ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • MAPE, RMSE, 그리고 추세 분류 정확도의 의미
    IT 2025. 8. 27. 07:21

    MAPE, RMSE, 그리고 추세 분류 정확도를 좀 더 자세히, 이해하기 쉽게 설명드리겠습니다. 데이터 모델 평가 지표로서 왜 중요한지, 수식의 의미와 실무 적용법 중심으로 깊게 풀어드릴게요.


    1. MAPE (평균 절대 백분율 오차) – 오차를 ‘퍼센트’로 평가하는 이유

    MAPE는 예측 결과의 오차를 ‘상대적인 비율’로 나타내는 지표입니다. 즉, 예측값이 실제값에서 얼마나 퍼센트 차이가 나는지 평균을 내는 것입니다.

    • 왜 퍼센트로 나타낼까?
      데이터가 절대값 차이가 커도 비율로 보면 얼마나 차이나는지 직관적으로 알 수 있어, 서로 다른 스케일(규모)의 데이터 비교가 쉽습니다.
    • 예를 들어 매출 1000만 원을 900만 원으로 예측했으면 오차는 100만 원이나, 이는 10% 오차로 표현해 모델의 정확도를 판단할 수 있습니다.
    • 수식 해설:

    $$
    MAPE = \frac{100}{n} \sum_{i=1}^{n} \left|\frac{y_i - \hat{y}_i}{y_i}\right|
    $$

    여기서 절대값(| |)은 예측이 실제보다 작든 크든 차이 크기만 보는 것을 의미합니다.

    • 활용 시 주의점
      실제값이 0에 가까운 경우, 분모가 매우 작아지기 때문에 MAPE 값이 급격히 커져 왜곡될 수 있습니다. 이럴 땐 다른 지표나 데이터 변환을 사용합니다.

    2. RMSE (평균 제곱근 오차) – 오차의 제곱과 제곱근으로 보는 이유

    RMSE는 ‘오차’를 단순히 더하는 대신, 오차를 제곱하여 음수와 양수의 부정 영향을 없애고, 큰 오차일수록 더 크게 반영되도록 설계된 지표입니다.

    • 수식 해설:

    $$
    RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2}
    $$

    • 제곱을 하면 왜 클까? 큰 오차를 더 강하게 ‘처벌’해서, 모델이 큰 실패를 줄이도록 유도합니다.
    • RMSE는 예측 오차를 원래 데이터 단위로 보여줘서 해석이 쉽습니다(예: 가격 단위, 매출액 단위 그대로).
    • RMSE가 낮다는 건, 모델 예측이 실제 값과 얼마나 가까운지 의미하며, 금융 및 시계열 예측에서 가장 많이 씁니다.

    3. 추세 분류 정확도 – 상승/하락 흐름 맞추는 능력 평가

    추세 분류 정확도는 주로 ‘상승’, ‘하락’, ‘유지’ 같은 카테고리형 데이터 분류 정확도를 말합니다.

    • 개념
      예를 들어 주가가 다음 시간에 오를지, 내릴지 맞추는 모델이 있다고 봅니다. 모델이 예측한 결과와 실제 결과가 맞으면 정확한 예측입니다.
    • 정확도 공식:

    $$
    정확도 = \frac{맞게 예측한 수}{전체 예측 수}
    $$

    • 반응할 점
      만약 상승이 90%인 데이터에서 모델이 항상 ‘상승’이라고 예측해도 정확도는 90%지만, 이런 경우는 모델이 실제로 추세를 구분하는 능력이 있다고 보기 어렵습니다.
    • 그래서 보통 정밀도(Precision), 재현율(Recall), F1 Score 같은 추가 평가 지표와 같이 봐야 제대로 된 성능 평가가 가능해집니다.

    실무에서의 활용 예

    • MAPE는 매출이나 가격, 투자 수익률과 같은 금액 단위 예측에서 상대 오차 크기를 보여줘서 기획이나 리포팅에 자주 사용됩니다.
    • RMSE는 가격 데이터 등 시간에 따라 오차의 크기 차이가 중요한 경우 더 민감하게 성능을 평가할 수 있어 투자 알고리즘 테스트 시 기본 지표가 됩니다.
    • 추세 분류 정확도는 상승·하락 시장 방향 판단, 매수/매도 신호 생성 같은 분류형 문제에서 필수적으로 보는 평가 지표입니다.

    요약

    지표명 평가 대상 계산 방식 장점 단점 및 주의사항
    MAPE 예측값과 실제값 백분율 오차 평균 절대 백분율 오차 계산 직관적, 스케일 영향 최소화 0 근처 실제값에서 오차 커짐
    RMSE 예측값과 실제값 제곱 차이 평균 제곱 오차에 루트 씌움 큰 오차 감지에 민감 이상치에 민감
    추세 분류 정확도 상승/하락 등 분류 문제 맞은 개수/전체 개수 해석 간단, 분류 정확도 판단 클래스 불균형 시 지표 왜곡 가능

     

Designed by Tistory.