머신러닝 분석/회귀 분석

모델 성능지표 한눈에 정리 – 예측력부터 분류 성능까지

Data Jun 2025. 3. 25. 15:05

머신러닝 모델을 평가할 때 성능지표를 올바르게 이해하는 것은 매우 중요합니다.
회귀 모델과 분류 모델에 따라 평가 방식이 달라지며, 지표마다 강조하는 포인트도 다릅니다.

이번 글에서는 대표적인 모델 성능 지표들을 회귀 모델 지표분류 모델 지표로 나눠 간단하게 소개합니다.

 

회귀 모델 성능지표

 MSE (Mean Squared Error)

  • 예측값과 실제값 사이의 오차 제곱 평균
  • 작을수록 예측이 잘된 것
  • 단점: 오차가 클수록 영향이 커짐 → 이상치 민감

MAPE (Mean Absolute Percentage Error)

  • 예측 오차를 퍼센트(%)로 표현
  • 직관적이고 해석이 쉬움 (0~100%)
  • 단점: 실제값이 0에 가까울 경우 불안정

 

분류 모델 성능지표

정확도 (Accuracy)

  • 전체 예측 중 정답률을 의미
  • 단순하고 직관적이지만, 불균형 데이터에선 속을 수 있음

 

정밀도, 재현율, 특이도

 

 

G-mean, F1-score

불균형 데이터 문제에서 중요한 지표

 

ROC Curve & AUC

  • 이진 분류 모델의 전체 성능 시각화
  • x축: 1 - 특이도, y축: 재현율
  • ROC 곡선 아래 면적(AUC)이 클수록 좋은 성능

AUC가 1에 가까울수록 완벽한 분류, 0.5에 가까울수록 무작위와 같음  

 

마무리 요약

 

어떤 지표를 써야 할까?

  • 예측 정확도만 보면 Accuracy지만,
    데이터 불균형이 크다면 F1-score, AUC, G-mean이 더 신뢰도 높음
  • 회귀 문제라면 MSE vs MAPE 중 해석 용이성과 안정성을 고려해 선택