결과
PMF 공식
P(X=k)=C(K,k)·C(N−K,n−k)/C(N,n)
팁: "적어도 하나"는 P(X≥1)=1−P(X=0).
분포(PMF 테이블 및 막대 차트)
| k | P(X=k) | CDF |
|---|
시뮬레이션(몬테카를로)
시행과 시드를 사용하여 실행을 재현합니다. 넓은 범위의 경우 도구는 빠르게 유지하기 위해 히스토그램을 비닝합니다.
실제 사례 및 해석
입력의 의미
- N: 모집단 크기(총 항목).
- K: 모집단의 "성공" 수(관심 있는 항목)
- n: 추출 수(표본 크기).
- k: 표본의 성공(무작위 변수 X)
이것을 사용하는 경우(이항분포과 비교)
- 초기하: 샘플링 교체하지 않고 (성공 확률은 추첨마다 변경됩니다.)
- 이항: 독립적인 시행 고정 성공 확률(종종 "대체" 또는 매우 큰 모집단)
- 경험 법칙: 샘플링 비율이 작은 경우(n/N이 작음) 초기하 및 이항
p = K/N가까이 있을 수 있습니다.
실제 사례(사전 설정을 사용해 보세요)
카드: 52장에서 5장을 뽑습니다. 정확히 2장의 에이스를 얻을 가능성은 얼마나 됩니까?
N=52, K=4, n=5로 설정하고 k=2로 "정확하게" 쿼리합니다.
검사: 100개 중 10개의 불량품, 표본 8 - 적어도 1개의 불량품이 있을 확률은 얼마입니까?
N=100, K=10, n=8로 설정하고 k=1인 경우 "최소"를 쿼리합니다.
빠르게 “적어도 하나”(보완 트릭)
계산 P(X ≥ 1) = 1 − P(X = 0). 도우미 버튼 “P(X≥1)”을 사용할 수도 있습니다.
일반적인 함정
- 잘못된 k: 지원은
k_min=max(0,n−(N−K))그리고k_max=min(n,K). 그 밖에는,P(X=k)=0. - '성공'을 명확하게 정의하라: "성공"은 계산하려는 항목 유형에 대한 레이블일 뿐입니다(예: "결함", "빨간색", "최고").
- 넓은 범위: 성능을 위해 PMF 테이블을 생략할 수 있습니다. 확률 결과 및/또는 시뮬레이션을 사용합니다.
참고자료
이 계산기를 효과적으로 사용하는 방법
유한한 모집단에서 복원 없이 표본을 추출할 때 이 계산기를 사용하십시오. 꼬리 확률을 해석하기 전에 모집단 크기, 성공 횟수, 추출 크기 및 목표 성공 횟수를 정의합니다.
작동 원리
이 페이지에서는 초기하분포 확률질량과 조합의 누적 꼬리를 평가합니다. 이는 유한 모집단 가정을 명시적으로 유지하므로 N, K, n 또는 k를 한 번에 하나씩 변경하고 정확한 확률과 예상 성공이 어떻게 움직이는지 관찰하여 시나리오를 비교합니다.
언제 사용하나요?
품질 관리 샘플링, 카드 또는 복권 스타일 추첨, 강의실 확률 확인 및 각 추출 후 항목을 되돌려 넣지 않는 위험 임계값에 사용하세요. 추첨이 독립적이거나 복원 추출로 효과적으로 수행되는 경우 대신 이항 모델과 비교하십시오.
피해야 할 일반적인 실수
- 각각의 추첨이 독립적이거나 모집단이 사실상 무제한인 경우 초기하분포를 사용합니다.
- 모집단 크기 N보다 큰 표본 크기 n을 입력하거나 N보다 큰 성공 횟수 K를 입력합니다.
- 정확히 k, 최대 k, 최소 k 성공이 필요한지 여부를 확인하지 않고 꼬리 확률을 비교합니다.
- 다운스트림 작업에서 반올림된 표시 값을 정확한 확률로 처리합니다.
해석 및 실제 사례
하나의 샘플링 계획으로 시작하여 P(X = k), P(X ≤ k) 및 P(X ≥ k)를 기록합니다. 그런 다음 추출 크기나 성공 기준점만 변경하여 위험이 어떻게 변하는지 확인하세요. 방향이 의외라고 느껴지면 결과를 사용하기 전에 성공 및 실패 범주가 실제 모집단과 일치하는지 확인하세요.
관련 도구
자주 묻는 질문
초기하 모델은 어떤 용도로 사용되나요?
각 항목이 반환되지 않는 유한한 모집단에서 추첨을 모델링하므로 각 추첨 후에 확률이 변경됩니다.
입력을 어떻게 설정하나요?
꼬리와 누적 값을 확인하기 전에 모집단 크기 N, 성공 항목 수 K, 추출 크기 n 및 목표 성공 횟수 k(또는 범위)를 설정합니다.
이것이 이항분포과 다른 이유는 무엇입니까?
이항분포는 복원 추출에 가까운 가정을 사용해 독립적인 추첨을 가정하는 반면, 초기하분포는 유한 모집단 고갈을 처리하고 복원 없는 표본 추출에 정확합니다.
꼬리 결과를 어떻게 해석해야 합니까?
꼬리 확률 결과는 '최소/최대' 시나리오를 요약하며 위험 검사, 임계값 및 결정 경계에 유용합니다.
의사결정에 결과를 사용할 수 있나요?
이를 시나리오 비교를 위한 정량적 신호로 사용한 다음 최종 결정 전에 상황 가정 및 운영 한계에 대해 검증합니다.
계산 방법
C(K,k)·C(N−K,n−k)/C(N,n)안정성을 위해 로그 공간에서 계산됩니다.k_min=max(0,n−(N−K)),k_max=min(n,K).