統計(推定・検定)

Bayes 更新、2x2 表、集団負荷、分類評価を、いまの目的から逆算して選べる統計ガイドです。式・odds・table・population burden のどこから入るかを先に決めると、最初の 1 本と次に進むページが定まります。

まずは「式から Bayes を追う」「odds の途中式で更新する」「2x2 表から RR / OR を読む」「集団負荷を absolute / fraction / percent でまとめる」「閾値固定の分類評価を確認する」のどれかを決めます。迷ったら、説明したい単位が確率・odds・表・population burden のどれか、そして最後に absolute / fraction / percent のどれで伝えるかから選ぶと近いページの違いまで整理しやすくなります。

混同行列 感度・特異度 尤度比 ベイズの定理 オッズ変換 事後オッズ 検査前後確率 NPV・PPV Youden の J F-beta 適合率・再現率 MCC バランス精度 ROC AUC 診断オッズ比 ARR / NNT NNS NNH リスク差 リスク差CI 帰属リスク 帰属リスク割合 集団寄与リスク 集団寄与割合 集団寄与リスク割合 曝露群寄与割合 リスク比 リスク比CI オッズ比 オッズ比CI Fisher exact McNemar 二項検定 Sign test Wilcoxon 符号付順位 Mann-Whitney U Kruskal-Wallis Friedman 検定 相対リスク・オッズ比 Cohen の κ Entropy / KL サンプルサイズ 効果量 検出力分析 信頼区間・仮説検定 線形回帰 パーミュテーションテスト クイックチャート
他の言語 日本語 | English | 简体中文 | 繁體中文 | 繁體中文(香港) | Español | Español (México) | Português (Brasil) | Português (Portugal) | Bahasa Indonesia | Tiếng Việt | 한국어 | Français | Deutsch | Italiano | Русский | हिन्दी | العربية | বাংলা | اردو | Türkçe | ไทย | Polski | Filipino | Bahasa Melayu | فارسی | Nederlands | Українська | עברית | Čeština

クイックガイド

  1. 2 値分類の結果を 1 つの閾値で点検したいなら混同行列を使います。正解率だけでなく、適合率・再現率・特異度を並べて確認できます。
  2. 感度と特異度をそのまま説明したいなら感度・特異度計算機を使います。FPR や FNR も一緒に見られるので、医療検査やスクリーニング説明に向いています。
  3. 陽性結果や陰性結果がどれだけ evidence を動かすかを odds 的に説明したいなら尤度比を使います。閾値を固定した後の説明に向いています。
  4. 事前確率から事後確率への更新を式から始めたいならベイズの定理を使います。Bayes 更新を式から始める最初の 1 本です。
  5. 確率とオッズの変換だけを先に済ませたいならオッズ・確率変換を使います。Bayes 更新の前後をつなぐ最短の橋渡しです。
  6. 尤度比があり、odds の掛け算という途中式を確認したいなら事後オッズ計算機を使います。Bayes 更新を odds の流れで説明するときの中心ページです。
  7. LR+ や LR− が分かっていて、事後確率だけを最短で出したいなら検査前後確率を使います。
  8. 現場での有病率が学習時と違うときに、陽性的中率と陰性的中率がどう変わるかを見たいなら NPV・PPV を使います。
  9. 感度と特異度の両方を落とさずに 1 つの threshold score で近い cutoff を比べたいなら Youden の J を使います。
  10. 適合率と再現率の両方を見たいが、どちらかを強めに重み付けしたいなら F-beta を使います。見逃し重視か誤検知重視かを beta で切り替えられます。
  11. 1 つの閾値で陽性クラスの誤検知と見逃しのバランスを見たいなら適合率・再現率を使います。ROC AUC より軽く、今の運用点の説明に向いています。
  12. 混同行列 4 セル全部を反映した 1 指標で見たいなら MCC を使います。クラス不均衡があっても正解率より安定して読めます。
  13. 多数派クラスの正解率が良く見えすぎていないかを確認したいなら balanced accuracy を使います。再現率と特異度を同じ重みで確認できます。
  14. 閾値をまだ決めていない score 分類なら ROC AUC を使います。感度と特異度が閾値ごとにどう動くかを曲線と表で確認できます。
  15. 閾値が陽性と陰性をどれだけ強く分けているかを 1 つの比率で見たいなら診断オッズ比を使います。LR+ と LR- も横に置いて解釈してください。
  16. 2 群の発生率から絶対差と NNT / NNH を読みたいなら ARR / NNT 計算機を使います。エビデンス解釈の橋渡しに向いています。
  17. 検診やスクリーニングで 1 件見つけるのに何人必要かを説明したいなら NNS 計算機を使います。有病率 × 検出率、または direct yield から人数換算できます。
  18. 害方向の絶対差を people-needed の言葉で説明したいなら NNH 計算機を使います。絶対リスク増加から NNH をすばやく確認できます。
  19. まずは絶対差だけを符号付きで読みたいならリスク差計算機を使います。比率や NNH に行く前の土台を作るのに向いています。
  20. 同じ 2x2 表でリスク差の方向だけでなく区間の幅まで確認したいならリスク差CI計算機を使います。リスク差ページの直後に置く区間確認ページです。
  21. 曝露群と非曝露群の差を exposure 起点で読みたいなら Attributable Risk 計算機を使います。attributable fraction まで一緒に確認できます。
  22. 曝露群のリスクのうち、どれだけが曝露に起因すると読めるかを割合で説明したいなら attributable risk percent を使います。
  23. 曝露率まで含めて集団全体の burden を説明したいなら population attributable risk を使います。attributable risk と exposure prevalence をつないで読めます。
  24. population burden を absolute な差ではなく、全体リスクの何割かとして説明したいなら population attributable fraction を使います。
  25. population burden を fraction ではなく、そのまま percent で報告したいなら population attributable risk percent を使います。報告文やスライドに直結しやすい最終出力ページです。
  26. 曝露群の中でどれだけが曝露起因かを fraction / percent の言い方で整理したいなら attributable fraction among exposed を使います。
  27. 2 群の 2x2 表があり、発生率ベースの倍率を最初に読みたいならリスク比計算機を使います。オッズ比へ広げる前の最短ルートです。
  28. 2x2 表からリスク比の点推定に加えて 90 / 95 / 99% 信頼区間までまとめて確認したいならリスク比CI計算機を使います。リスク比ページの次に置く区間確認ページです。
  29. 症例対照研究や希少イベント寄りで 2x2 表から odds ベースの差を最初に読みたいならオッズ比計算機を使います。リスク比より odds 比較を優先したい場面の入口です。
  30. 2x2 表からオッズ比に加えて 90 / 95 / 99% 信頼区間の幅まで確認したいならオッズ比 CI 計算機を使います。点推定だけでなく不確実性もまとめて読みたい場面に向いています。
  31. 2x2 表が小さい、または疎で、まず exact p 値を確認したいなら Fisher exact test 計算機を使います。RR / OR / リスク差の読みへ進む前に、有意差を exact に押さえる入口です。
  32. 同じ対象の前後比較や matched pair の 2x2 表で、discordant pair が片側へ偏るかを exact に見たいなら McNemar 検定計算機を使います。小さい paired 2x2 の入口として Fisher や RR / OR と切り分けやすくなります。
  33. 1 標本の成功数を基準割合と exact に比べたいなら二項検定計算機を使います。標本サイズや信頼区間へ進む前に、1 つの割合が珍しいかを押さえる入口です。
  34. 対応ありの before / after で差の大きさより方向だけを exact に確かめたいなら Sign test 計算機を使います。Wilcoxon へ進む前に、符号だけで paired change を読む最短ページです。
  35. 同じ対象の前後差が連続値または順序尺度で、paired t 検定ほど正規性を仮定したくないなら Wilcoxon 符号付順位検定を使います。paired continuous / ordinal の入口として、McNemar や二項検定と自然に切り分けられます。
  36. 独立した 2 群の連続値や順序尺度を、2 標本 t 検定ほど分布仮定に寄せず順位ベースで比べたいなら Mann-Whitney U 検定を使います。paired の Wilcoxon と、独立群の nonparametric 入口を切り分けたいときに向いています。
  37. 独立した 3 群以上の連続値や順序尺度を、平均ベースの ANOVA ほど分布仮定に寄せず順位で比べたいなら Kruskal-Wallis 検定を使います。Mann-Whitney U を 3 群以上へ広げた nonparametric 入口です。
  38. 同じ対象を 3 条件以上で測った paired data を、反復測定 ANOVA ほど分布仮定に寄せず順位で比べたいなら Friedman 検定を使います。Wilcoxon 符号付順位検定を 3 条件以上へ広げた repeated-measures の入口です。
  39. 2 群の event / non-event 数から相対リスクとオッズ比を並べて読みたいなら相対リスク・オッズ比計算機を使います。ARR / NNT や診断オッズ比の手前で比較の土台を作れます。
  40. 2 人の評価者や 2 回のラベリング結果が、偶然を超えてどれだけ一致しているかを見たいなら Cohen の κ を使います。
  41. 分布の不確かさや、P と Q のずれを見たいなら entropy / KL を使います。ゼロ確率や正規化の影響もその場で確認できます。
  42. 調査前に必要数を決めるならサンプルサイズ計画から始めます。
  43. 差の大きさを p 値とは別に確認したいなら効果量計算機を使います。Cohen の d、Hedges の g、η² を要約値からすぐ比較できます。
  44. どの程度の効果を拾えるか、または今の n でどれくらいの検出力があるかを見たいなら検出力分析を使います。
  45. 不確かさを数値化し、差を確認するなら信頼区間・検定。
  46. 関係を説明したいなら回帰(回帰直線/相関)。
  47. 前提が置きにくい場合はパーミュテーションテストも便利。

目的別の入口

ツール

電卓