ベイズの定理計算機|事前確率と尤度から事後確率を求める
事前確率・尤度(感度)・偽陽性率の3つをスライダーで入力すると、ベイズの定理で事後確率 P(A|B) と周辺確率 P(B) を算出。0.01%〜99.99% を 0.0001 刻みで動かせるため、有病率が低い領域の「確率の逆転」も扱える。
💡 このツールについて
「99% の精度を持つ検査で陽性だった。では病気である確率は 99%」——多くの人がこう直感するが、これは誤り。検査の精度(感度)と、陽性者が実際に病気である確率(事後確率)はまったく別物。両者を分けるのが、母集団における有病率=事前確率である。
このツールは、事前確率・感度・偽陽性率という3つのパラメータを動かしながら、事後確率がどう変化するかを目で追える。例えば有病率 1%・感度 99%・偽陽性率 5% を入れると、陽性時に実際に病気である確率はわずか 16.67%。検査が優秀でも、稀な事象では偽陽性が真陽性を圧倒する「偽陽性のパラドックス」が起きていることが、比較バーの長さの差で直感的に分かる。
医療診断だけでなく、スパムフィルタの判定、A/B テストの結果解釈、品質検査の合否判定など、「ある証拠を見たあとに仮説の確率をどう更新するか」を考える場面すべてに応用できる。
🧐 よくある質問
Q. 事前確率・尤度・偽陽性率はそれぞれ何を指しますか? 事前確率 P(A) は証拠を見る前の仮説の確率(有病率など)。尤度 P(B|A)(感度)は仮説が真のときに証拠が観測される確率。偽陽性率 P(B|¬A) は仮説が偽なのに証拠が出てしまう確率。この3つから事後確率を計算する。
Q. 感度が高いのに事後確率が低くなるのはなぜですか? 事前確率(有病率)が極端に低いと、健康な大多数からわずかに出る偽陽性の絶対数が、病気の人から出る真陽性を上回るため。これが「基準率の無視(base rate neglect)」と呼ばれる錯覚の正体。
Q. 周辺確率 P(B) とは何ですか? 証拠 B が観測される全体の確率。真陽性と偽陽性を合わせた値で、P(B|A)P(A) + P(B|¬A)(1−P(A)) で求まる。ベイズの定理の分母にあたる。
Q. 特異度しか分かりません。偽陽性率に変換できますか? 偽陽性率 = 1 − 特異度。特異度 95% なら偽陽性率は 5% として入力する。
Q. 0.01% より小さい確率は入力できますか? スライダーの下限は 0.0001(0.01%)。極端に稀な事象はこの下限近辺で近似して扱う。
📚 ベイズの定理の豆知識
定理の名はイギリスの牧師トマス・ベイズに由来するが、生前は未発表で、死後に友人リチャード・プライスが論文として世に出した。「ベイズの定理」を現在の一般的な形にまとめ広めたのは、独立に同じ着想へ至ったフランスの数学者ラプラスだとされる。
日本では統計学の授業より、迷惑メールフィルタの仕組みとして名前を聞いた人が多いかもしれない。初期のベイジアンフィルタは、メール内の単語が「迷惑メールに出る確率」を事前確率として学習し、新着メールの単語列から事後確率を更新して判定していた。受信者が手で「迷惑メール」に振り分けるたびに事前確率が更新される——このツールでスライダーを動かす行為が、フィルタの内部で繰り返されている計算そのものに近い。