F分布の確率計算|ANOVA・回帰のF検定で右側p値を読む
分子自由度 d1、分母自由度 d2、観測 F 値の 3 つから、F 分布の確率密度 (PDF)、累積確率 (CDF)、右側 p 値を同時に求めます。p<0.05 などの有意水準の判定までその場で表示するため、分散分析表や回帰の出力に並んだ F 値が統計的に有意かどうかを数表を引かずに確認できます。
💡 このツールについて
分散分析 (ANOVA) や回帰分析を回すと、結果に F 値が出てきます。ただ F 値そのものは「この値が大きいほど効果が強い」という相対的な指標で、自由度の組み合わせが変われば同じ F 値でも意味が変わります。最終的に欲しいのは「この F 値は偶然では起きにくいのか (p 値)」という判断です。
従来は巻末の F 分布表を引き、d1 と d2 の交点にある臨界値と観測 F 値を見比べていました。しかし数表は α=0.05 や 0.01 など限られた水準しか載っておらず、正確な p 値そのものは読み取れません。このツールは F 値を入れると右側 p 値 (P(X>x)) を小数 6 桁で返すので、「p=0.088 だから 0.05 水準では有意ではない」といった判断を曖昧さなく下せます。
統計の自由度は 2 つあります。分子側 d1 は群間 (要因) の自由度で、一元配置 ANOVA なら水準数 k から 1 を引いた値です。分母側 d2 は群内 (誤差) の自由度で、全標本数 n から k を引いた値になります。回帰なら d1 が説明変数の数、d2 が残差自由度です。この 2 つを取り違えると p 値がまるで変わるので、入力ラベルのヒントを確認しながら入れてください。
🧐 よくある質問
Q. 右側 p 値と CDF はどう違いますか? CDF は P(X≤x)、つまり観測値以下になる確率です。F 検定で使うのは右側 p 値 P(X>x) = 1−CDF で、観測 F 値と同じかそれより極端な値が偶然出る確率を表します。本ツールは両方を表示します。
Q. 自由度はどちらを d1 に入れますか? 群間 (要因・説明変数側) の自由度を d1、群内 (残差・誤差側) の自由度を d2 に入れます。一元配置 ANOVA では d1 = k−1、d2 = n−k です。順序を逆にすると確率が大きく変わります。
Q. p 値が小さいほど何が言えますか? 同じ d1・d2 の F 分布では、F 値が大きいほど右側 p 値は小さくなります。p が小さいほど「群間に差がない」という帰無仮説のもとでは起きにくい、つまり差が統計的に有意だと判断できます。
Q. F 値に負の数は入れられますか? 入れられません。F 統計量は 2 つの分散の比なので必ず 0 以上です。負の値や数値以外を入れると結果欄は「—」のままになります。
Q. 自由度を大きくすると分布はどうなりますか? d1・d2 がともに大きくなると F 分布は 1 付近に集中していきます。本ツールは 1〜1000 を想定範囲としており、極端な値では数値精度がわずかに落ちる場合があります。
📚 F分布と統計の豆知識
F 分布の「F」は、分散分析の枠組みを築いた統計学者ロナルド・フィッシャーにちなんだものです。F 検定は 2 つの分散の比を扱うため、平均を比べる t 検定とは別系統の検定として、品質管理や実験計画の分野で長く使われてきました。
日本の研究現場では、心理学や農学、医療統計の実験で一元配置・二元配置 ANOVA が定番です。論文の表に「F(2, 27) = 4.21, p < .05」と書かれているとき、括弧の中の 2 と 27 がまさに d1 と d2 です。この表記を見たら、本ツールに 2・27・4.21 を入れれば論文と同じ p 値を再現でき、検定結果の追試や勉強の確認に役立ちます。