Calculateur de Probabilité de la Distribution F | Lis le seuil d'un test F
Saisis les degrés de liberté du numérateur, ceux du dénominateur et une valeur F observée pour obtenir d'un coup la densité de probabilité (PDF), la probabilité cumulée (CDF) et la p-valeur à droite de la loi F. L'outil signale aussi si le résultat franchit le seuil p<0,05, p<0,01 ou p<0,001, ce qui permet de juger une statistique F d'ANOVA ou de régression sans consulter une table imprimée.
💡 À propos de cet outil
Lorsque tu lances une ANOVA ou une régression, tu obtiens une statistique F. Seule, ce n'est qu'un rapport de variances : plus elle est grande, plus le signal l'emporte sur le bruit, mais savoir si cette valeur est surprenante dépend des deux degrés de liberté. Ce qu'il te faut vraiment, c'est la p-valeur : à quel point ce F est improbable si l'hypothèse nulle est vraie.
La méthode classique consistait à chercher la valeur critique dans une table F, à la ligne de d1 et la colonne de d2. Le souci : ces tables n'impriment que quelques niveaux alpha (0,05, 0,01) et jamais la p-valeur exacte. Ce calculateur renvoie la p-valeur à droite P(X>x) à six décimales dès que tu saisis la valeur F, si bien que tu peux conclure « p = 0,088, le seuil de 0,05 n'est pas franchi » sans ambiguïté.
Il y a toujours deux degrés de liberté. Le df du numérateur (d1) est le df inter-groupes ou du modèle : dans une ANOVA à un facteur, c'est le nombre de niveaux k moins 1 ; en régression, c'est le nombre de variables explicatives. Le df du dénominateur (d2) est le df intra-groupes ou résiduel : n moins k en ANOVA. Les intervertir change complètement la p-valeur, alors vérifie l'indice sous chaque champ.
🧐 Questions fréquentes
Quelle est la différence entre la CDF et la p-valeur à droite ? La CDF est P(X≤x), la probabilité de tomber à ta valeur ou en dessous. Le test F utilise la p-valeur à droite P(X>x) = 1−CDF, la probabilité d'observer un F aussi extrême ou plus par hasard. L'outil affiche les deux.
Quel df va dans d1 ? Le df inter-groupes (facteur ou variable explicative) va dans d1 ; le df intra-groupes (résiduel ou erreur) va dans d2. En ANOVA à un facteur, d1 = k−1 et d2 = n−k. Les inverser donne un autre résultat.
Une p-valeur plus petite signifie-t-elle un effet plus fort ? À d1 et d2 fixés, une valeur F plus grande donne une p-valeur à droite plus petite. Une p plus petite signifie que le résultat est moins probable sous l'hypothèse nulle d'absence de différence, donc la différence est plus probablement significative.
Puis-je saisir une valeur F négative ? Non. Une statistique F est un rapport de deux variances, elle est donc toujours nulle ou positive. Une entrée négative ou non numérique laisse les champs de sortie sur « — ».
Que se passe-t-il avec de très grands degrés de liberté ? À mesure que d1 et d2 augmentent, la loi F se concentre autour de 1. L'outil est conçu pour des df entre 1 et 1000 ; aux valeurs extrêmes, la précision numérique peut légèrement baisser.
📚 D'où vient la distribution F
Le « F » rend hommage à Ronald Fisher, qui a bâti le cadre de l'analyse de variance dans les années 1920. Comme le test F compare deux variances plutôt que deux moyennes, il appartient à une autre famille que le test t et sous-tend la maîtrise de la qualité, le plan d'expériences et le test global de significativité en régression.
La forme de la loi F n'est jamais symétrique : elle part de zéro, monte vers un pic puis décroît avec une longue queue à droite. C'est pourquoi le test est unilatéral : seule la queue droite mesure l'écart de ton F par rapport à la valeur attendue sous l'hypothèse nulle. Saisir différents d1 et d2 et observer l'évolution de la valeur p et du verdict de significativité est un bon moyen d'ancrer cette intuition.