Calculadora de Probabilidade da Distribuição F | Leia a significância de um teste F
Informe os graus de liberdade do numerador, os do denominador e um valor F observado para obter de uma vez a densidade de probabilidade (PDF), a probabilidade acumulada (CDF) e o valor p de cauda direita da distribuição F. A ferramenta ainda sinaliza se o resultado cruza o limiar p<0,05, p<0,01 ou p<0,001, então você avalia uma estatística F de ANOVA ou de regressão sem recorrer a uma tabela impressa.
💡 Sobre esta ferramenta
Quando você roda uma ANOVA ou uma regressão, recebe uma estatística F de volta. Sozinha, ela é apenas uma razão de variâncias: quanto maior, mais sinal em relação ao ruído, mas se esse valor é surpreendente ou não depende dos dois graus de liberdade. O que você realmente quer é o valor p: quão improvável esse F seria se a hipótese nula fosse verdadeira.
O método clássico era procurar o valor crítico em uma tabela F, na linha de d1 e na coluna de d2. O problema é que essas tabelas só imprimem alguns níveis alfa (0,05, 0,01) e nunca o valor p exato. Esta calculadora devolve o valor p de cauda direita P(X>x) com seis casas decimais assim que você digita o valor F, de modo que pode concluir "p = 0,088, não cruza o limiar de 0,05" sem ambiguidade.
Há sempre dois graus de liberdade. O df do numerador (d1) é o df entre grupos ou do modelo: numa ANOVA de um fator é o número de níveis k menos 1, e na regressão é o número de preditores. O df do denominador (d2) é o df dentro dos grupos ou residual: n menos k na ANOVA. Trocar os dois muda completamente o valor p, então confira a dica abaixo de cada campo.
🧐 Perguntas frequentes
Qual a diferença entre a CDF e o valor p de cauda direita? A CDF é P(X≤x), a probabilidade de cair no seu valor ou abaixo. O teste F usa o valor p de cauda direita P(X>x) = 1−CDF, a probabilidade de observar um F tão extremo ou mais por acaso. A ferramenta mostra os dois.
Qual df vai em d1? O df entre grupos (fator ou preditor) vai em d1; o df dentro dos grupos (residual ou erro) vai em d2. Na ANOVA de um fator, d1 = k−1 e d2 = n−k. Inverter os dois dá outro resultado.
Um valor p menor indica um efeito mais forte? Com os mesmos d1 e d2, um valor F maior produz um valor p de cauda direita menor. Um p menor significa que o resultado é menos provável sob a hipótese nula de nenhuma diferença, então a diferença é mais provavelmente significativa.
Posso informar um valor F negativo? Não. Uma estatística F é uma razão de duas variâncias, portanto é sempre 0 ou maior. Uma entrada negativa ou não numérica deixa os campos de saída em "—".
O que acontece com graus de liberdade muito grandes? À medida que d1 e d2 crescem, a distribuição F se concentra perto de 1. A ferramenta foi projetada para df entre 1 e 1000; em valores extremos a precisão numérica pode cair um pouco.
📚 De onde vem a distribuição F
O "F" homenageia Ronald Fisher, que construiu o arcabouço da análise de variância nos anos 1920. Como o teste F compara duas variâncias em vez de duas médias, ele pertence a uma família diferente da do teste t e sustenta o controle de qualidade, o planejamento de experimentos e o teste global de significância na regressão.
A forma da distribuição F nunca é simétrica: parte de zero, sobe até um pico e cai com uma longa cauda à direita. Por isso o teste é unilateral: só a cauda direita mede o quanto o seu F se afasta do valor esperado sob a hipótese nula. Testar diferentes d1 e d2 na ferramenta e observar como mudam o valor p e o veredito de significância é um jeito rápido de fixar essa intuição.