Calculadora de probabilidade da distribuição binomial negativa | PMF, CDF e sobrevivência juntas
Informe os sucessos-alvo r, a probabilidade de sucesso p e as falhas k para ler a PMF, a CDF e a probabilidade de sobrevivência da distribuição binomial negativa NB(r, p), além de média, variância, desvio-padrão e moda, tudo em uma única tela. Suporta r de 1 a 1000 e p de 0,01 a 0,99.
💡 Sobre esta ferramenta
A distribuição binomial negativa modela "quantas falhas ocorrem antes do r-ésimo sucesso" e aparece com frequência em engenharia de confiabilidade, planejamento de experimentos e preparação de testes A/B. Calcular à mão é trabalhoso: o coeficiente binomial C(k+r-1, k) cresce muito rápido e uma calculadora de bolso estoura quando k+r passa de algumas centenas.
Esta ferramenta avalia o coeficiente em espaço logarítmico com uma função log-gama (aproximação de Lanczos), de modo que a PMF permanece precisa mesmo quando k+r chega aos milhares, sem estouro numérico. PMF, CDF e sobrevivência ficam em três cartões lado a lado, então você move o limiar k e lê "exatamente k falhas", "no máximo k falhas" e "k ou mais falhas" de uma só vez.
Vale fixar uma convenção: aqui k é o número de falhas observadas antes do r-ésimo sucesso (a parametrização do SciPy / Wikipédia). Alguns livros definem k como o número do ensaio em que ocorre o r-ésimo sucesso, o que altera a fórmula. A nota abaixo dos campos indica qual está em uso.
🧐 Perguntas frequentes
P. Qual a diferença para a distribuição binomial? R. A binomial fixa o número de ensaios e conta os sucessos; a binomial negativa fixa o número de sucessos r e conta as falhas. As caras em cinco lançamentos seguem uma binomial; as coroas que aparecem ao lançar até obter cinco caras seguem uma binomial negativa.
P. O que acontece quando r = 1? R. Com r = 1 a binomial negativa se reduz à distribuição geométrica: falhas antes do primeiro sucesso. A binomial negativa é a geométrica generalizada para r sucessos.
P. Para que serve a sobrevivência P(X ≥ k)? R. É a probabilidade de observar k ou mais falhas antes de alcançar r sucessos. Use-a para dimensionar o risco de as falhas ultrapassarem um orçamento, por exemplo "qual a chance de gastar 20 ou mais tentativas antes de acertar 5 vezes?".
P. Quais são as fórmulas de média e variância? R. A média é r(1-p)/p, a variância é r(1-p)/p² e o desvio-padrão é a raiz quadrada da variância. Quanto menor o p, maiores tanto as falhas esperadas quanto a dispersão.
P. Posso inserir valores grandes de k? R. k vai de 0 a 2000 e r de 1 a 1000. A CDF soma os termos da PMF de 0 até k, então um k maior significa apenas mais termos na soma acumulada.
📚 Por que o nome tem "negativa"
O termo "negativa" vem da álgebra, não dos valores: a função geradora de probabilidade se expande em coeficientes binomiais com expoente negativo, graças ao teorema binomial generalizado de Newton, que estende (a+b)^n a potências não inteiras e negativas.
Na prática, essa distribuição é o modelo de referência para superdispersão. Quando dados de contagem têm variância maior que a média, um modelo de Poisson fica aquém e a binomial negativa assume. O motivo é elegante: ao supor que a taxa λ de Poisson segue uma distribuição gama e integrá-la, a distribuição marginal resultante é exatamente uma binomial negativa — por isso misturas Poisson-gama e regressão binomial negativa descrevem a mesma ideia por dois caminhos.