Formule de test F

Définition de la formule du test F

La formule du test F est utilisée pour effectuer le test statistique qui aide la personne effectuant le test à déterminer si les deux ensembles de population qui ont la distribution normale de leurs points de données ont le même écart-type ou non.

Le test F est un test qui utilise la distribution F. La valeur F est une valeur sur la distribution F. Divers tests statistiques génèrent une valeur F. La valeur peut être utilisée pour déterminer si le test est statistiquement significatif. Afin de comparer deux variances, il faut calculer le rapport des deux variances, ce qui revient à:

Valeur F = plus grande variance d'échantillon / plus petite variance d'échantillon = σ 1 2 / σ 2 2

Pendant le test F dans Excel, nous devons encadrer les hypothèses nulles et alternatives. Ensuite, nous devons déterminer le niveau de signification sous lequel le test doit être effectué. Par la suite, nous devons connaître les degrés de liberté du numérateur et du dénominateur. Cela aidera à déterminer la valeur de la table F. La valeur F vue dans le tableau est ensuite comparée à la valeur F calculée pour déterminer s'il faut ou non rejeter l'hypothèse nulle.

Calcul étape par étape d'un test F

Vous trouverez ci-dessous les étapes où la formule du test F est utilisée pour annuler l'hypothèse que les variances de deux populations sont égales:

  • Étape 1: Tout d'abord, encadrez l'hypothèse nulle et alternative. L'hypothèse nulle suppose que les variances sont égales. H 0 : σ 1 2 = σ 2 2 . L'hypothèse alternative stipule que les variances sont inégales. H 1 : σ 1 2  σ 2 2 . Ici, σ 1 2 et σ 2 2 sont les symboles des variances.
  • Étape 2: Calculez la statistique du test (distribution F). c'est-à-dire = σ 1 2 / σ 2 2, où σ 1 2 est supposée être la plus grande variance de l'échantillon et σ 2 2 est la plus petite variance de l'échantillon
  • Étape 3: Calculez les degrés de liberté. Degré de liberté (df 1 ) = n 1 - 1 et Degré de liberté (df 2 ) = n 2 - 1 où n 1 et n 2 sont les tailles d'échantillon
  • Étape 4:   Regardez la valeur F dans le tableau F. Pour les tests à 2 queues, divisez l'alpha par 2 pour trouver la bonne valeur critique. Ainsi, la valeur F est trouvée en regardant les degrés de liberté dans le numérateur et le dénominateur dans la table F. Df 1 est lu dans la rangée du haut. Df 2 est lu dans la première colonne.

Remarque: Il existe différents tableaux F pour différents niveaux de signification. Ci-dessus se trouve la table F pour alpha = 0,050.

  • Étape 5: Comparez la statistique F obtenue à l'étape 2 avec la valeur critique obtenue à l'étape 4. Si la statistique F est supérieure à la valeur critique au niveau de signification requis, nous rejetons l'hypothèse nulle. Si la statistique F obtenue à l'étape 2 est inférieure à la valeur critique au niveau de signification requis, nous ne pouvons pas rejeter l'hypothèse nulle.

Exemples

Vous pouvez télécharger ce modèle Excel de formule de test F ici - Modèle Excel de formule de test F

Exemple 1

Un statisticien effectuait un test F. Il a obtenu la statistique F comme 2,38. Les degrés de liberté obtenus par lui étaient de 8 et 3. Trouvez la valeur F de la table F et déterminez si nous pouvons rejeter l'hypothèse nulle à un niveau de signification de 5% (test unilatéral).

Solution:

Nous devons rechercher 8 et 3 degrés de liberté dans le tableau F. La valeur critique F obtenue à partir du tableau est 8,845 . Puisque la statistique F (2,38) est inférieure à la valeur de table F (8,845), nous ne pouvons pas rejeter l'hypothèse nulle.

Exemple # 2

Une compagnie d'assurance vend des polices d'assurance maladie et d'assurance automobile. Les primes sont payées par les clients pour ces politiques. Le PDG de la compagnie d'assurance se demande si les primes payées par l'un ou l'autre des segments d'assurance (assurance maladie et assurance automobile) sont plus variables par rapport à un autre. Il trouve les données suivantes pour les primes payées:

Effectuer un test F bilatéral avec un niveau de signification de 10%.

Solution:

  • Étape 1: Hypothèse nulle H 0 : σ 1 2 = σ 2 2

Hypothèse alternative H a : σ 1 2  σ 2 2

  • Étape 2: Statistique F = Valeur F = σ 1 2 / σ 2 2 = 200/50 = 4
  • Étape 3: df 1 = n 1 - 1 = 11-1 = 10

df 2 =  n 2 - 1 = 51-1 = 50

  • Étape 4: Puisqu'il s'agit d'un test bilatéral, le niveau alpha = 0,10 / 2 = 0,050. La valeur F de la table F avec des degrés de liberté 10 et 50 est 2,026.
  • Étape 5: Puisque la statistique F (4) est supérieure à la valeur de table obtenue (2.026), nous rejetons l'hypothèse nulle.

Exemple # 3

Une banque a un siège social à Delhi et une succursale à Mumbai. Il y a de longues files d'attente de clients dans un bureau, tandis que les files d'attente de clients sont courtes dans l'autre bureau. Le directeur des opérations de la banque se demande si les clients d'une agence sont plus variables que le nombre de clients d'une autre agence. Une étude de recherche de clients est réalisée par lui.

La variance des clients du siège social de Delhi est de 31 et celle de la succursale de Mumbai est de 20. La taille de l'échantillon pour le siège de Delhi est de 11 et celle de la succursale de Mumbai est de 21. Effectuer un test F bilatéral avec un niveau de signification de 10%.

Solution:

  • Étape 1:   Hypothèse nulle H 0 : σ 1 2 = σ 2 2

Hypothèse alternative H a : σ 1 2  σ 2 2

  • Étape 2: Statistique F = Valeur F = σ 1 2 / σ 2 2 = 31/20 = 1,55
  • Étape 3: df 1 = n 1 - 1 = 11-1 = 10

df 2 =  n 2 - 1 = 21-1 = 20

  • Étape 4: Puisqu'il s'agit d'un test bilatéral, le niveau alpha = 0,10 / 2 = 0,05. La valeur F de la table F avec des degrés de liberté 10 et 20 est 2,348.
  • Étape 5: Puisque la statistique F (1,55) est inférieure à la valeur de la table obtenue (2,348), nous ne pouvons pas rejeter l'hypothèse nulle.

Pertinence et utilisations

La formule F-Test peut être utilisée dans une grande variété de paramètres. Le test F est utilisé pour tester l'hypothèse que les variances de deux populations sont égales. Deuxièmement, il est utilisé pour tester l'hypothèse que les moyennes de populations données qui sont normalement distribuées, ayant le même écart-type, sont égales. Troisièmement, il est utilisé pour tester l'hypothèse qu'un modèle de régression proposé correspond bien aux données.

Formule de test F dans Excel (avec modèle Excel)

Les travailleurs d'une organisation reçoivent un salaire journalier. Le PDG de l'organisation est préoccupé par la variabilité des salaires entre les hommes et les femmes au sein de l'organisation. Ci-dessous, les données proviennent d'un échantillon d'hommes et de femmes.

Effectuer un test F unilatéral à un niveau de signification de 5%.

Solution:

  • Étape 1: H 0 : σ 1 2 = σ 2 2, H 1 : σ 1 2  σ 2 2
  • Étape 2: Cliquez sur l'onglet Données> Analyse des données dans Excel.

  • Étape 3: La fenêtre mentionnée ci-dessous apparaîtra. Sélectionnez F-Test Two-Sample pour les variances, puis cliquez sur OK.

  • Étape 4: Cliquez sur la case Plage variable 1 et sélectionnez la plage A2: A8. Cliquez sur la case Plage variable 2 et sélectionnez la plage B2: B7. Cliquez sur A10 dans la plage de sortie. Sélectionnez 0,05 comme alpha car un niveau de signification est de 5%. Cliquez ensuite sur OK.

Les valeurs de la statistique F et de la valeur de la table F seront affichées avec d'autres données.

  • Étape 4: À partir du tableau ci-dessus, nous pouvons voir que la statistique F (8,296) est supérieure à F critique unilatérale (4,95), nous rejetterons donc l'hypothèse nulle.

Remarque 1: La variance de la variable 1 doit être supérieure à la variance de la variable 2. Sinon, les calculs effectués par Excel seront erronés. Sinon, échangez les données.

Remarque 2: Si le bouton Analyse des données n'est pas disponible dans Excel, accédez à Fichier> Options. Sous Compléments, sélectionnez Analysis ToolPak et cliquez sur le bouton Aller. Vérifiez le pack d'outils d'analyse et cliquez sur OK.

Remarque 3: il existe une formule dans Excel pour calculer la valeur de la table F. Sa syntaxe est: