딥러닝 모델에서 평가 지표는 어떤 모델의 성능을 측정하는 단위가 되기 때문에 매우 중요합니다.
모델에 대해서 평가를 할 수 없다면 모델들끼리의 좋고 나쁜지 알 수 없기 때문입니다.
성능을 위해서 사용되는 지표의 기본 개념들을 알아보겠습니다.
Confusion Matrix(TP, FP, TN, FN)
저 위에 설명이 직관적으로 와닿지 않을 수 있습니다. 조금 풀어 써보겠습니다.
먼저 TP, FP, TN, FN의 단어 뒷부분을 담당하는 Positive(or Negative)는 나의 생각을 나타냅니다.
내가 문제를 정답으로 생각하냐 오답으로 생각하냐를 나타냅니다.
그렇다면 단어 앞부분의 True(or False)는 내 생각이 맞는지 틀린지 정해주는 기준이 됩니다.
그리고 단어를 해석할 때, 단어 뒷부분의 P(or N)을 먼저 해석한 다음 앞의 T(or F)를 해석하면 됩니다.
그럼 이제부터 하나씩 따져보겠습니다.
TP : 뒤에 P가 있으니 내 생각은 정답이라고 생각하겠습니다. 앞에 T가 있으니 실제로도 내 생각이 맞았네요.
→ 정답을 정답으로 판단하였습니다.(정답을 맞춘 상황)
FP : 뒤에 P가 있으니 내 생각은 정답이라고 생각하겠습니다. 앞에 F가 있으니 실제로는 내 생각이 틀렸네요.
→ 오답을 정답으로 판단하였습니다.
TN : 뒤에 N이 있으니 내 생각은 오답이라고 생각하겠습니다. 앞에 T가 있으니 실제로도 내 생각이 맞았네요.
→ 오답을 오답으로 판단하였습니다.(오답을 맞춘 상황)
FN : 뒤에 N이 있으니 내 생각은 오답이라고 생각하겠습니다. 앞에 F가 있으니 실제로는 내 생각이 틀렸네요.
→ 정답을 오답으로 판단하였습니다.
나머지 평가 지표도 정리되는 대로 이어서 작성해보겠습니다.
Reference
TN FN TN FP
Precision, Recall
mAP(mean Average Precision)
Dice coefficient