検定したいシナリオを選び、標本の要約統計量を入力すると、統計量・臨界値・信頼区間・p値・計算手順をまとめて表示します。入力内容はURLに保存されるため、チームで共有しやすくなります。
解析前の例: 1標本平均の既定値(n=10、x̄=5.2、s=2.4、帰無平均 4、95%信頼水準)では、区間はあり得る平均値の範囲、p 値は帰無モデルとの整合性として読みます。計算後の p 値図は対応する Student の t 分布の尾を塗ります。
結果
入力を設定して実行すると、要約・区間・結論が表示されます。
主要な指標
解釈
計算手順
p値の可視化
授業でのポイント
- Studentのt分布の分位点は正則化不完全ベータ関数で算出し、小標本でも教科書と同じ値を再現します。
- Welchの自由度、Wilsonスコア、Newcombeの差区間を採用し、分散が異なる場合や比率が境界に近い場合も被覆率を維持します。
- 共有URLにはシナリオ、要約統計、検定の向き、信頼水準を埋め込むため、班で同じレポートを即座に再現できます。
FAQ
p値の塗り分けは何を示していますか?
数値で得られたp値に対応する棄却域を図示します。両側検定では左右両端、片側検定では対立仮説の方向だけが塗られるため、視覚的に判断できます。
Wilson区間やNewcombe区間はどのように計算していますか?
Wilsonはz値に基づくスコア区間を使います。Newcombeは2つのWilson区間を組み合わせ、プール近似に頼らず差の区間を推定します。
平均と比率のどちらを選べばよいですか?
測定値の平均を比べるなら平均、成功/失敗や賛成/反対の割合を扱うなら比率を選びます。1群か2群か、母標準偏差が既知かも検定方法の選択に関係します。
信頼区間と仮説検定はどう使い分けますか?
信頼区間は効果の大きさと不確かさを幅で見るために使い、仮説検定は帰無仮説の下で観測結果がどれくらい珍しいかをp値で確認します。両方を合わせて読むと判断しやすくなります。
p値だけで結論を決めてもよいですか?
p値は判断材料の1つです。効果量、信頼区間、事前に決めた有意水準、サンプルサイズ、データ収集方法をあわせて確認してください。