← 수학 & 통계

통계 분류

ROC AUC 계산기

다른 언어 日本語 | English | 繁體中文 | 한국어 | Italiano | فارسی

이진 점수, 레이블 행을 붙여넣어 ROC 곡선, AUC 및 임계값 테이블을 계산합니다. 모델이 점수를 출력할 때 이를 사용하고 다음 질문은 컷오프 변경에 따라 민감도와 특이도가 어떻게 움직이는지입니다.

혼동 행렬은 하나의 임계값을 요약합니다. 이 페이지에서는 먼저 전체 임계값 스윕을 요약한 다음 하나의 임계값 후보를 강조하여 운영 규칙을 확정하기 전에 장단점을 논의할 수 있습니다.

사용방법

  1. 한 줄에 하나의 점수, 라벨 쌍을 붙여넣습니다. 모델이 잘 작동할 때 점수는 음성 사례보다 양성 사례의 순위를 매겨야 합니다.
  2. 다음과 같은 값에서 라벨이 명확하지 않은 경우 선택적으로 양성 라벨을 명시적으로 설정하세요. 1 또는 case.
  3. 품질 순위를 알아보려면 AUC를 읽은 다음 임계값 테이블과 ROC 곡선을 검사하여 실제 작동 컷오프를 선택하세요.

ROC 및 AUC에 대한 이진 점수 순위

이 첫 번째 릴리스는 바이너리 전용이며 점수 전용입니다. 주요 질문이 점수 순서 지정 및 임계값 균형인 경우 정밀 재현 곡선 또는 보정 플롯 전에 이를 사용하십시오.

입력

점수, 레이블 행을 붙여넣고 계산을 실행하여 ROC 장단점을 검사합니다.

ROC 곡선

계산기를 실행하여 ROC 곡선을 검사합니다. 차트에 초점을 맞추고 ← / →를 사용하여 임계값을 넘어 이동합니다.

임계값 테이블

표에는 점수 스윕의 첫 번째 임계값 행이 나열되어 있습니다. 임계값이 낮을수록 일반적으로 민감도는 증가하고 특이도는 감소합니다.

임계값 ≥ 감도 특이성 FPR TP FP TN FN

ROC AUC를 읽는 방법

ROC AUC는 점수가 모든 임계값에서 음성 사례보다 양성 사례를 얼마나 잘 평가하는지 묻습니다. 0.5에 가까운 값은 순서가 무작위에 가깝다는 것을 의미합니다. 값이 높을수록 양성이 음성보다 더 높은 점수를 받는 경향이 있음을 의미합니다.

기준점은 여전히 중요합니다

높은 AUC는 작동 컷오프를 선택하지 않습니다. 올바른 임계값은 거짓 양성, 거짓 음성 또는 리뷰 양으로 인한 지연 등 워크플로에서 더 큰 피해를 주는 요소에 따라 달라집니다.

혼동 행렬과 ROC AUC

사용 혼동 행렬 임계값이 이미 고정되어 있고 하나의 운영 스냅샷이 필요한 경우. 임계값이 아직 열려 있고 결정하기 전에 전체 스윕을 비교해야 하는 경우 ROC AUC를 사용하십시오.

자주 묻는 질문

ROC AUC는 혼동 행렬과 어떻게 다릅니까?

혼동 행렬은 선택된 하나의 임계값을 설명합니다. ROC AUC는 여러 임계값에서 민감도와 특이도가 어떻게 상충되는지 설명하므로, 하나의 운영 구분을 적용하기 전에 점수가 음성 사례보다 양성 사례의 순위를 얼마나 잘 지정하는지 알려줍니다.

임계값을 이동하면 무엇이 변경되나요?

임계값이 낮을수록 더 많은 사례를 양성으로 분류하므로 일반적으로 민감도가 증가하고 특이도가 감소합니다. 임계값이 높을수록 그 반대가 됩니다. 임계값 테이블을 사용하면 해당 절충안을 행별로 검사할 수 있습니다.

AUC가 높으면 사용할 임계값을 자동으로 알려주나요?

아니요. AUC는 임계값 전체에 걸쳐 순위 품질을 요약하지만, 운영 임계값은 여전히 거짓양성 대 거짓음성의 비용, 양성 비율 및 작업 흐름 제약 조건에 따라 달라집니다.

이 페이지는 멀티클래스 ROC를 지원합니까?

아니요. 이 첫 번째 릴리스는 의도적으로 이진 분류로 제한되어 점수 순서, ROC 곡선 및 임계값 테이블을 쉽게 감사할 수 있습니다.

설명(선택사항)

부하를 줄이기 위해 필요할 때만 주석을 가져옵니다.