カイ二乗検定 計算機 | 観測値と期待値から χ² 値・p 値・棄却限界を算出
観測度数 O と理論度数 E のリストから、適合度検定 (goodness-of-fit) のカイ二乗統計量・自由度・上側 p 値・棄却限界を一画面で算出。p 値と有意水準 α を比べた棄却 / 採択の判定までブラウザ内で完結。
💡 このツールについて
サイコロが偏っているか、メニューの注文比率が想定通りか、A/B テストのクリック分布が均等か。こうした「観測した個数の散らばりが、理論上の散らばりからどれだけずれているか」を数値で示すのがカイ二乗適合度検定です。
計算式はシンプルで、各カテゴリの (観測値 − 期待値)² を期待値で割って合計するだけ。χ² = Σ (O − E)² / E。ただし、求めた χ² が「偶然のばらつきで説明できる範囲か、それとも有意なずれか」を判断するには、自由度に応じたカイ二乗分布の上側確率 (p 値) と、有意水準に対応する棄却限界が必要です。この計算は手計算では数表を引く手間がかかり、表に載っていない自由度では補間が必要になります。
このツールは p 値を不完全ガンマ関数 (級数展開と連分数を自由度で切り替え、収束精度 1e-14) で直接評価するため、数表に頼らず任意の自由度で正確な値を返します。棄却限界も二分法で逆 CDF を解いて算出。観測値と期待値を貼り付けるだけで、χ² 値・自由度 (カテゴリ数 − 1)・p 値・棄却限界・判定文がそろいます。
🧐 よくある質問
Q. p 値と棄却限界、どちらで判定すればいいですか? どちらでも同じ結論になります。p < α なら帰無仮説 (観測値は期待値に従う) を棄却、χ² > 棄却限界でも同じく棄却。このツールは両方を表示するので、論文やレポートで使いたい方を選べます。
Q. 自由度はなぜ「カテゴリ数 − 1」なのですか? 全カテゴリの観測値の合計が期待値の合計と等しいという制約が 1 つ入るため、自由に動けるのはカテゴリ数より 1 少なくなります。期待値をデータから推定するパラメータがある場合 (例: 平均や分散を推定した分布への当てはめ) は、さらにその個数だけ自由度が減りますが、このツールは期待値を既知として扱う基本形の適合度検定です。
Q. 期待値はどう決めればいいですか? 帰無仮説が「均等」なら全カテゴリに合計 ÷ カテゴリ数。比率が決まっているなら合計 × 各比率。期待値は度数 (count) であって確率や割合ではない点に注意してください。各期待値が 5 未満のセルが多いと近似が崩れるため、その場合はカテゴリを統合するか別の検定を検討します。
Q. 観測値と期待値の合計が一致しなくても計算できますか? 計算自体は動きますが、適合度検定では合計を一致させるのが前提です。期待値の合計が観測値の合計と異なると、自由度の解釈や p 値の妥当性が崩れます。期待値は「観測値の総数を理論比率で配分した度数」として入力してください。
Q. 独立性の検定 (クロス集計表) にも使えますか? このツールは 1 次元の適合度検定に特化しています。2 × 2 や r × c の分割表で独立性を見る場合は、自由度が (行数 − 1) × (列数 − 1) になり、期待値もマージンから計算する必要があるため、別途その形に整えた値を入力する運用になります。
📚 豆知識
カイ二乗検定は 1900 年にカール・ピアソンが発表した、統計学で最初期の有意性検定の一つです。「χ²」というギリシャ文字が使われるのは、検定統計量が標準正規分布に従う変数の二乗和として近似的に表せることに由来します。自由度が大きくなるとカイ二乗分布は正規分布に近づき、χ² ≈ df 付近に山が来ます。実務では適合度・独立性・等質性の 3 用途で広く使われ、機械学習の特徴量選択でもカテゴリ変数と目的変数の関連を測る指標として登場します。