対数正規分布の確率計算|μ・σ・x から PDF と CDF を一括算出
対数 ln x が正規分布に従うとき、その元の値 x が描く分布が対数正規分布。μ・σ・x を入れるだけで確率密度 PDF、累積確率 CDF、平均・中央値・最頻値・標準偏差の 6 指標を同時に表示する計算ツール。
💡 このツールについて
株価のリターン、所得、粒径、ファイルサイズ——これらに共通するのは「負にならず、右に長い裾を引く」という形。正規分布の釣鐘型では裾の確率を過大評価してしまい、現実とズレる。対数正規分布はこのズレを埋めるために使われる。
ただし手計算は厄介。確率密度には x・σ・√(2π) の積と指数関数が絡み、累積確率には標準正規分布の累積分布関数 Φ が必要で、正規分布表とにらめっこする羽目になる。さらに「分布のパラメータ μ・σ」と「実際の平均・中央値・最頻値」は別物で、μ をそのまま平均と勘違いする取り違えが起きやすい。
このツールは μ・σ・x の 3 つを入れると、密度と累積確率に加えて、平均 E[X] = exp(μ + σ²/2)、中央値 exp(μ)、最頻値 exp(μ − σ²) を機械的に並べる。中央値・平均・最頻値がこの順に右へずれる「右裾」の感覚を、数値で確かめられる。
🧐 よくある質問
μ や σ は元の x の平均・標準偏差ですか? いいえ。μ と σ は「ln x(x の自然対数)」が従う正規分布の平均と標準偏差。元の x の平均は exp(μ + σ²/2) で別に計算され、ツールでは「平均 E[X]」として表示される。
μ = 0 にすると何が起きますか? 中央値 exp(μ) が exp(0) = 1 になる。σ を変えても中央値は 1 のまま、平均と最頻値だけが動くので、σ が分布の広がりに与える効果を観察しやすい。
なぜ平均・中央値・最頻値が一致しないのですか? 右に裾を引く非対称な分布だから。少数の大きな値が平均を引き上げ、最頻値(山の頂点)<中央値<平均、の順に並ぶ。σ が大きいほどこの差は開く。
x はどんな値を入れればよいですか? 0 より大きい正の数なら何でも。株価、粒径、所得額など、対象に合わせた値を入れる。0 以下は対数正規分布で定義されないため、ツール側で正の最小値に補正される。
CDF の値は何を意味しますか? X が入力した x 以下になる確率。例えば CDF が 0.79 なら、その分布から取り出した値の約 79% が x 以下に収まる。パーセント表記も併記される。
📚 対数正規分布をめぐる豆知識
この分布の起源は 1879 年、フランシス・ゴルトンとマカリスターの研究にさかのぼる。1903 年にはカプテインが「掛け算的に積み重なる現象」として捉え直した。決定打となったのが 1931 年、経済学者ジブラが提唱した「比例効果の法則」で、ある量が毎期ランダムな比率で増減すると結果が対数正規分布に近づくことを示した。足し算の積み重ねが正規分布なら、掛け算の積み重ねが対数正規分布、という対の関係が背景にある。
日本の実務でも、品質管理における粒度分布、信頼性工学での製品寿命、地震のマグニチュード関連量など、右裾を持つ正の量を扱う場面で繰り返し登場する。所得分布も人口の大半(およそ 97〜99%)が対数正規でよく近似されることが知られ、富の偏りを語る土台にもなっている。「平均」だけを見ると実態を見誤る——そんな歪んだデータを読むための古典的な道具が、この分布である。