평균 절대 오차 (MAE, Mean Absolute Error)

핸즈온 머신러닝 2

평균 절대 오차 와 같이 회귀 문제에 선호되는 성능 측정 방법이지만,
노름의 지수가 클수록 큰 값의 원소에 치우치며 작은 값은 무시된다.
따라서 RMSE보다 MAE가 이상치에 조금 더 민감하다.

wikipedia

평균 절대 편차(MAD, Mean Absolute Deviation)이라고도 한다.
산포도의 하나로, 평균과 개별 관측치 사이 거리의 평균이다.
각 측정치에서 전체 평균 값을 뺀 값의 절댓값으로 표시되는 편차들의 합에서 산술평균을 말한다.
매우 크거나 작은 어느 하나의 값인 이상치로 인한 문제점을 보완할 수 있는 방법으로 사용되고 있다.

MAE 식

\[MAE(X,h) = \frac{1}{m}\sum_{i=1}^{m}\left|h(x^{(i)})-y^{(i)}\right|\]

해석

  • X = 데이터셋에 있는 모든 샘플의 모든 특성값을 포함하는 행렬
  • m = 데이터셋 샘플 수
  • $ x^{i} $ 는 데이터셋에 있는 i번째 샘플의 전체 특성값의 벡터이다.
  • $ y^{i} $ 는 해당 레이블(해당 샘플의 기대 출력값)이다.
  • h = 시스템의 예측 함수이며 가설이라고도 한다.
    • $ h(x^{i}) $ 은 $ x^{i} $ 벡터를 예측 함수에 넣었을 때 출력하는 예측값이다.

$ \hat{y}^{(i)} $ 는 에측 값이며 $ y^{(i)} $ 는 기대 출력값이다. 두 값을 빼면 예측 오차를 얻을 수 있다.
따라서 1부터 m 까지(모든 샘플 수) 예측 오차의 합의 절대값은 두 벡터 값 사이의 거리이다.
두 벡터 값 사이의 거리(노름)의 지수가 클수록 큰 값의 원소에 치우쳐 작은 값은 무시된다.


참고문헌

1) wikipedia, 평균 절대 편차, https://ko.wikipedia.org/wiki/평균_절대_편차