← 수학 & 통계

통계 분류

혼동행렬 계산기

다른 언어 日本語 | English | 繁體中文 | 한국어 | Italiano

TP, FP, TN 및 FN을 입력하여 이진 혼동 행렬에서 정확도, 정밀도, 재현율, 특이성, F1 점수 및 보급률을 계산합니다.

이 첫 번째 릴리스는 의도적으로 바이너리 전용입니다. 멀티클래스, 임계값 조정 또는 ROC/PR 곡선으로 이동하지 않고도 분류 측정항목을 빠르게 감사해야 할 때 사용하세요.

사용방법

  1. TP, FP, TN, FN 등 혼동 행렬 수를 입력합니다.
  2. 선택적으로 행렬이 사용자의 데이터 세트처럼 읽혀지도록 포지티브 및 네거티브 클래스의 이름을 바꿉니다.
  3. 정밀도를 읽고 정확성 옆에 기억하세요. 특히 한 클래스가 드물다면 더욱 그렇습니다.

하나의 매트릭스에서 나온 이진 분류 측정항목

모델 또는 규칙이 이미 이진 예측을 생성한 후에 이 페이지를 사용하십시오. 임계값 조정 워크플로가 아닌 분류 지표에 대한 읽기 페이지입니다.

입력

계산을 실행하여 혼동 행렬의 분류 측정항목을 확인하세요.

정확성이 전부는 아닙니다

네거티브 클래스가 지배적일 때 정확도는 높게 유지될 수 있습니다. 이러한 상황에서 분류기는 전반적으로 괜찮아 보이지만 여전히 많은 긍정적인 사례가 누락될 수 있습니다. 이것이 바로 이 페이지가 정확성 외에 재현성, 특이성, 정확성 및 보급률을 유지하는 이유입니다.

정밀도 대 재현율

Precision은 "모델이 긍정적이라고 말하면 얼마나 자주 옳은가요?"라고 묻습니다. Recall은 "모든 실제 긍정적인 것 중에서 얼마나 많은 것을 포착했습니까?"라고 묻습니다. 하나를 개선하면 다른 하나도 해칠 수 있으므로 올바른 균형은 거짓 긍정과 거짓 부정의 비용에 따라 달라집니다.

바이너리 우선 릴리스

이 첫 번째 릴리스는 이진 분류를 유지하므로 각 지표를 TP, FP, TN 및 FN에서 쉽게 감사할 수 있습니다. 다중 클래스 행렬, ROC 곡선 및 임계값 스윕은 첫 번째 버전에 혼합되지 않고 이후 확장에 속합니다.

자주 묻는 질문

정확성만으로는 충분하지 않은 이유는 무엇입니까?

한 클래스가 드물면 정확도가 높아 보일 수 있습니다. 불균형 데이터세트에서는 정확도보다 정밀도, 재현율, 특이성, 보급률이 모델 동작에 대해 더 많은 정보를 제공하는 경우가 많습니다.

정밀도와 재현율의 차이점은 무엇입니까?

정밀도는 예측된 긍정이 얼마나 자주 맞는지 묻습니다. 재현율은 모델이 포착한 실제 긍정의 수를 묻습니다. 하나는 거짓 긍정에 초점을 맞추고 다른 하나는 거짓 부정에 초점을 맞춥니다.

이 페이지는 다중클래스 혼동 행렬을 지원합니까?

아니요. 이 첫 번째 릴리스는 의도적으로 이진 분류로 제한되므로 핵심 측정항목을 쉽게 감사하고 비교할 수 있습니다.

공유 URL에 내 개수나 라벨이 포함되어 있나요?

아니요. 공유 URL은 소수점 이하 자릿수와 같은 간단한 설정만 저장합니다. 개수와 맞춤 라벨은 브라우저에 그대로 유지됩니다.

설명(선택사항)

부하를 줄이기 위해 필요할 때만 주석을 가져옵니다.