Wilson スコア信頼区間 計算ツール|小サンプル・極端比率に強い区間推定
成功数と試行回数から、二項比率の Wilson スコア信頼区間を求めるツール。標本が小さい場合や成功率が 0% / 100% に近い場合でも、範囲外(0 未満・1 超)にはみ出さない安定した区間を返す。90 / 95 / 99% の信頼水準に加え、任意の z 値も指定可能。
💡 このツールについて
「賛成 40 / 投票 50 だから支持率 80%」——この点推定だけでは、母集団の真の比率がどの幅に収まるかが分からない。区間推定が必要になる場面で、よく教科書に載っている正規近似(Wald 法)は、試行回数が少なかったり比率が 0% や 100% に近いと、信頼区間の端が 0 を下回ったり 1 を超えたりして実用に耐えなくなる。
Wilson スコア法は、この弱点を構造的に避けた区間推定。区間の中央が観測比率そのものではなく (p̂ + z²/2n) / (1 + z²/n) という補正済みの値になり、結果として区間全体が必ず 0〜1 の内側に収まる。少ない試行回数でも破綻しにくいため、A/B テストの初期サンプルや、票数の少ない項目の評価で重宝する。
このツールでは成功数・試行回数・信頼水準を入れるだけで、観測比率(p̂)、Wilson 区間 [下限, 上限]、区間中央、区間幅(半幅)を 4 桁小数と百分率の両方で表示する。
🧐 よくある質問
Wald 法(正規近似)と何が違うのか? Wald 法は区間の中央を観測比率 p̂ にそのまま置き、左右対称に幅を取る。試行が少ない・比率が極端だと端が 0〜1 を超える。Wilson 法は中央を補正して左右非対称な区間にし、常に 0〜1 内に収める。
成功数が 0、または試行数と同じ(全成功)でも計算できるか? できる。Wald 法では幅がゼロに潰れてしまう 0% / 100% のケースでも、Wilson 区間は有限の幅を持つ。これがこの区間推定の代表的な利点。
z 値は何を入れればよいか? 両側信頼水準に対応する標準正規分布の臨界値。90% は 1.6449、95% は 1.96、99% は 2.5758。これら以外(80% の 1.2816 など)を使いたいときはカスタム z 値を選んで直接入力する。
区間中央が観測比率とずれているのはなぜか?
Wilson 法では中央が (p̂ + z²/2n) / (1 + z²/n) で、観測比率を 0.5 方向へわずかに引き寄せた値になる。試行回数 n が大きくなるほどこのずれは小さくなり、観測比率に近づく。
s が n を超える値を入れたら? 成功数は試行回数以下である必要があるため、超えた場合は自動的に n に揃える。
📚 Reddit のコメント並び順と Wilson 下限
票数の少ない投稿やコメントを「賛成率」だけで並べると、1 票だけ賛成の項目が支持率 100% として最上位に来てしまう。これを避けるため、Wilson 信頼区間の下限値を使って並べ替える手法が広く知られている。下限値は試行回数が増えるほど観測比率に近づき、少数票の項目には大きなペナルティがかかるので、「票数は少ないが確からしい」評価が自然と上位に来る。コメントランキングや商品レビューの並べ替えなど、母数のばらつく多数の項目を公平に比較したい場面で使われる考え方。