이 글을 보기 전에 https://fakecan.tistory.com/58 에서 confusion matrix(TP, FP, TN, FN)을 보시기 바랍니다.
모델을 평가하려면 지표가 필요합니다. 이런 지표 중에서 대표적이라 할 수 있는 Precision(정밀도)과 Recall(재현율)을
이해해보겠습니다.
설명하기 이전에, 사용 모델을 '나'라고 치환해서 설명하겠습니다.
e.g. 내가 맞다고 분류한 것 중에서 실제로 맞는 것의 비율 → 모델이 맞다고 분류한 것 중에서 실제로 맞는 것의 비율
그리고 '판단'이라는 말을 '예측'이라는 말로 생각하셔도 무방합니다.
Precision(정밀도)
- 내가 맞다고 판단한 것 중에서 실제로 맞는 것의 비율
TP : 내가 맞다고 판단한 것이 실제로 맞는 것(정답을 맞힌 상황)
FP : 내가 맞다고 판단한 것이 실제로 틀린 것
TP + FP : 내가 맞다고 판단한 것들(정답 여부와는 상관없이)
Recall(재현율)
- 실제로 맞는 것 중에서 내가 맞다고 판단한 것의 비율
TP : 내가 맞다고 판단한 것이 실제로 맞는 것(정답을 맞힌 상황)
FN : 내가 틀리다고 판단한 것이 실제로 맞는 것
TP + FN : 나의 판단을 떠나서 실제로 맞는 것들
Precision과 Recall의 공통점
Precision과 Recall은 내가 정답을 맞히는 경우(TP)에 관심이 있다.
Precision과 Recall의 차이점
단순히 보는 관점(기준)의 차이입니다.
Precision은 나의 관점에서 정답을 맞히는 경우(TP)를 따지고
Recall은 정답의 관점에서 정답을 맞히는 경우(TP)를 따지고 있습니다.
Reference