Calculadora do Teste Qui-Quadrado | χ², p-valor e valor crítico de observados vs esperados
Calcule a estatística qui-quadrado de aderência, os graus de liberdade, o p-valor da cauda superior e o valor crítico a partir de uma lista de frequências observadas e esperadas. A conclusão de rejeitar ou não rejeitar frente ao seu alfa é decidida dentro do navegador.
💡 Sobre esta ferramenta
Um dado está viciado? Os pedidos do cardápio batem com a proporção que você planejou? Os cliques de um teste A/B se distribuem de forma uniforme entre as variantes? O teste qui-quadrado de aderência quantifica o quanto frequências observadas se afastam das que uma hipótese prevê.
A fórmula é curta: para cada categoria, eleve ao quadrado a diferença entre observado e esperado, divida pelo esperado e some: χ² = Σ (O − E)² / E. O difícil é julgar se esse χ² é só ruído ou um desvio real. Esse julgamento exige a probabilidade da cauda superior da distribuição qui-quadrado nos graus de liberdade corretos (o p-valor) mais o valor crítico do seu alfa. À mão, é preciso uma tabela impressa e interpolação sempre que seus df não aparecem.
Esta calculadora avalia o p-valor diretamente pela função gama incompleta — uma expansão em série abaixo da moda e uma fração contínua acima dela, com convergência a 1e-14 — e por isso devolve um valor exato em qualquer grau de liberdade sem consultar tabelas. O valor crítico vem da resolução por bisseção da CDF inversa. Cole suas duas listas e você obtém χ², df (categorias − 1), p-valor, valor crítico e a conclusão.
🧐 Perguntas frequentes
P. Decido pelo p-valor ou pelo valor crítico? Qualquer um leva à mesma conclusão. Rejeite a hipótese nula (o observado segue o esperado) quando p < α, ou de modo equivalente quando χ² supera o valor crítico. A ferramenta mostra os dois para você citar o que seu relatório ou professor pedir.
P. Por que df é "categorias − 1"? Porque o total observado é obrigado a igualar o total esperado, um grau de liberdade é gasto. Se você estimou parâmetros a partir dos dados para construir os esperados (por exemplo, ajustando uma distribuição após estimar sua média), perde mais um df por parâmetro estimado. Esta ferramenta trata os esperados como dados: o caso clássico de aderência de uma via.
P. Como defino as frequências esperadas? Para uma hipótese "uniforme", use total ÷ número de categorias em cada célula. Para uma proporção fixa, use total × cada proporção. Lembre que os esperados são contagens, não probabilidades nem porcentagens. Se muitas células têm esperado menor que 5, a aproximação enfraquece: una categorias ou use um teste exato.
P. Funciona se os totais de observados e esperados não coincidirem? A aritmética ainda roda, mas a aderência pressupõe que os totais coincidam. Quando o total esperado difere do observado, a interpretação dos df e o p-valor perdem o sentido. Insira os esperados como "o total observado distribuído segundo suas proporções teóricas".
P. Serve para um teste de independência (tabela de contingência)? Esta ferramenta é para o teste de aderência unidimensional. Para uma tabela 2 × 2 ou r × c que testa independência, df vale (linhas − 1) × (colunas − 1) e os esperados vêm das margens de linhas e colunas, então você teria de achatar esses esperados marginais nas duas listas por conta própria.
📚 Curiosidades
Karl Pearson apresentou o teste qui-quadrado em 1900, um dos primeiríssimos testes de significância da estatística. A letra grega χ² é usada porque a estatística é aproximadamente uma soma de variáveis normais padrão ao quadrado. À medida que os graus de liberdade crescem, a distribuição qui-quadrado tende a uma forma normal com o pico perto de χ² ≈ df. Na prática o teste cobre aderência, independência e homogeneidade, e ainda aparece no aprendizado de máquina como pontuação de seleção de atributos para medir a relação entre uma variável categórica e o alvo.