負の二項分布 確率計算ツール|PMF・CDF・上側確率を 1 画面で
目標成功回数 r、成功確率 p、失敗回数 k を入れるだけで、負の二項分布 NB(r, p) の確率質量 PMF・累積分布 CDF・上側確率に加え、平均・分散・標準偏差・最頻値の 7 項目をまとめて確認できる計算ツール。r=1〜1000、p=0.01〜0.99 に対応。
💡 このツールについて
負の二項分布は「r 回目の成功が起きるまでに何回失敗するか」を表す離散分布で、信頼性工学・実験計画・A/B テスト設計でよく登場する。手計算では二項係数 C(k+r-1, k) と p^r·(1-p)^k の掛け算で桁が一気に大きくなり、電卓では k+r が数百を超えると桁あふれする。
このツールは対数ガンマ関数(Lanczos 近似)で二項係数を対数空間で計算するため、k+r が数千でも数値オーバーフローせずに PMF を返す。PMF・CDF・上側確率を 3 枚のカードで横並びにしたので、k のしきい値を動かしながら「ちょうど k 回失敗する確率」「k 回以下で済む確率」「k 回以上かかる確率」を一度に読み取れる。
なお本ツールは k を「r 回目の成功までの失敗回数」と定義する慣例(SciPy・Wikipedia 系)を採用している。教科書によっては k を「r 回目の成功が起きる試行番号」とする流儀もあるため、入力欄下の注記で定義を明示している。
🧐 よくある質問
Q. 二項分布とは何が違いますか? A. 二項分布は試行回数を固定して成功回数を数える分布、負の二項分布は成功回数 r を固定して失敗回数を数える分布。コインを 5 回投げたときの表の回数は二項分布、5 回表が出るまで投げ続けたときの裏の回数は負の二項分布になる。
Q. r=1 にすると何になりますか? A. r=1 の負の二項分布は幾何分布と一致する。負の二項分布は「1 回目の成功までの失敗回数」を扱う幾何分布の一般形にあたる。
Q. 上側確率 P(X≥k) は何に使いますか? A. 「r 回成功するまでに k 回以上失敗する確率」を表す。テストや試行のコスト見積もりで「失敗が一定回数を超えるリスク」を評価したいときに読む。
Q. 平均・分散の式は? A. 平均は r(1-p)/p、分散は r(1-p)/p²、標準偏差はその平方根。p が小さいほど失敗回数の期待値もばらつきも大きくなる。
Q. k に大きな値を入れても計算できますか? A. k は 0〜2000、r は 1〜1000 の範囲で計算する。CDF は 0 から k までの PMF を逐次加算するため、k が大きいほど和の項数が増える点に留意する。
📚 負の二項分布の豆知識
「負の二項」という名前は、確率母関数を展開すると指数が負の二項係数の形になることに由来する。普通の二項定理 (a+b)^n を負の指数に拡張したニュートンの一般二項定理がその背景にある。
過分散(オーバーディスパージョン)の文脈でも頻出する。観測カウントデータの分散が平均より大きい場合、ポアソン分布では表現しきれず、負の二項分布が代替モデルとして使われる。これはポアソン分布のパラメータ λ 自体がガンマ分布に従うと仮定したときの周辺分布が負の二項分布になるという性質に基づく。