超幾何分布(くじ引き・戻さない抽出)の計算

母集団Nのうち当たりK個を、戻さずにn回引いたときに当たりがk個出る確率を計算します。

計算はブラウザ内で完結します。棒グラフやシミュレーション(モンテカルロ)で理論値と比較できます。

使い方(3ステップ)

  1. N(母集団)と K(当たりの数)と n(引く回数)を入力
  2. 「ちょうど / 以下 / 以上 / 範囲」を選び、k(または a,b)を入力
  3. 結果と分布(棒グラフ・表)を確認し、必要ならシミュレーションで検算
他の言語: en | ja | es

入力

求めたい確率
例:
補助:

結果

確率
kの範囲
平均
分散
計算方法
式(PMF)

P(X=k)=C(K,k)·C(N−K,n−k)/C(N,n)

ヒント: 「少なくとも1個当たり」= P(X≥1)=1−P(X=0)

分布(PMF表・棒グラフ)
kP(X=k)CDF
シミュレーション(モンテカルロ)

試行回数とseedを指定すると再現できます。範囲が大きい場合はヒストグラムを自動でまとめます。

推定確率
理論との差(絶対)
理論との差(相対)
推定平均
推定分散

例題

トランプ: 52枚から5枚、エースが2枚出る確率

N=52、K=4、n=5、k=2 で「ちょうど」を選びます。

抜き取り: 100個中不良10個、8個検査で「少なくとも1個不良」

N=100、K=10、n=8、「以上」で k=1 を指定します(補集合でもOK)。

よくある質問

超幾何分布とは?

母集団Nのうち当たりK個があるとき、戻さずにn回抽出して当たりが何個出るか(X)の分布です。

二項分布との違いは?

超幾何分布は戻さない抽出(確率が変わる)、二項分布は独立試行(確率が一定)です。

kの範囲(最小/最大)は?

k_min=max(0,n−(N−K))、k_max=min(n,K) です。範囲外のkは確率0です。

「少なくとも1個当たり」はどう計算する?

補集合で P(X≥1)=1−P(X=0) と計算できます。

seed(シード)とは?

同じseedなら同じシミュレーション結果を再現できます。

関連

計算のポイント

  • PMF: C(K,k)·C(N−K,n−k)/C(N,n) を log 空間で計算して安定化します。
  • kの範囲: k_min=max(0,n−(N−K))k_max=min(n,K)
  • シミュレーションは固定seedに対応し、推定値と理論値の差を表示します。