Test du chi carré dans Excel

Test du chi carré avec Excel

Le test du chi carré dans Excel est le test non paramétrique le plus couramment utilisé pour comparer deux variables ou plus pour des données sélectionnées au hasard. C'est un type de test qui est utilisé pour découvrir la relation entre deux ou plusieurs variables, il est utilisé dans les statistiques qui est également connu sous le nom de valeur P Chi-carré, dans Excel, nous n'avons pas de fonction intégrée mais nous pouvons utiliser formules pour effectuer le test du chi carré dans Excel en utilisant la formule mathématique du test du chi carré.

Les types

  1. Test du chi carré pour la qualité de l'ajustement
  2. Test du chi carré pour l'indépendance de deux variables.

# 1 - Test du chi carré pour la qualité de l'ajustement

Il permet de percevoir la proximité d'un échantillon qui convient à une population. Le symbole du test du Chi-carré est (2). Il s'agit de la somme de tous les ( Nombre observé - Nombre attendu) 2 / Nombre attendu.

  • où k-1 degrés de liberté ou DF.
  • Oi est la fréquence observée, k les catégories et Ei la fréquence attendue.

Remarque: - La qualité de l'ajustement d'un modèle statistique fait référence à la compréhension de l'adéquation des données d'échantillon à un ensemble d'observations.

Les usages

  • La solvabilité des emprunteurs en fonction de leur tranche d'âge et de leurs prêts personnels
  • La relation entre la performance des vendeurs et la formation reçue
  • Retour sur un seul titre et sur des actions d'un secteur comme le pharmaceutique ou la banque
  • Catégorie de téléspectateurs et impact d'une campagne TV.

# 2 - Test du chi carré pour l'indépendance de deux variables

Il est utilisé pour vérifier si les variables sont autonomes les unes des autres ou non. Avec (r-1) (c-1) degrés de liberté

Oi est la fréquence observée, r est le nombre de lignes, c est le nombre de colonnes et Ei est la fréquence attendue

Remarque: - Deux variables aléatoires sont dites indépendantes si la distribution de probabilité d'une variable n'est pas affectée par l'autre.

Les usages

Le test d'indépendance convient aux situations suivantes:

  • Il existe une variable catégorielle.
  • Il existe deux variables catégorielles et vous devrez déterminer la relation entre elles.
  • Il existe des tableaux croisés et la relation entre deux variables catégorielles doit être trouvée.
  • Il existe des variables non quantifiables (par exemple, des réponses à des questions telles que, les employés de différents groupes d'âge choisissent-ils différents types de régimes de santé?)

Comment faire le test du chi carré dans Excel? (avec exemple)

Vous pouvez télécharger ce modèle Excel de test Chi Square ici - Modèle Excel de test Chi Square

Le gérant d'un restaurant souhaite trouver la relation entre la satisfaction client et les salaires des personnes en attente de tables. En cela, nous allons mettre en place l'hypothèse pour tester le Chi-carré

  • Elle prend un échantillon aléatoire de 100 clients demandant si le service était excellent, bon ou mauvais.
  • Elle classe ensuite les salaires des personnes en attente comme étant faibles, moyens et élevés.
  • Supposons que le niveau de signification soit de 0,05. Ici, H0 et H1 dénotent l'indépendance et la dépendance de la qualité de service vis-à-vis des salaires des personnes aux tables d'attente.
  • H 0 - la qualité du service ne dépend pas des salaires des personnes qui attendent les tables.
  • H 1 - la qualité du service dépend des salaires des personnes qui attendent les tables
  • Ses résultats sont présentés dans le tableau ci-dessous:

En cela, nous avons 9 points de données, nous avons 3 groupes dont chacun a reçu un message différent sur le salaire et le résultat est donné ci-dessous.

Maintenant, nous allons compter la somme de toutes les lignes et colonnes. Nous le ferons à l'aide de la formule ie SUM. Pour totaliser l'excellent dans la colonne du total, nous avons écrit = SUM (B4: D4) , puis appuyez sur Entrée.

Cela nous donnera 26 . Nous ferons de même avec toutes les lignes et colonnes.

Pour calculer le degré de liberté (DF), nous utilisons (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Il existe 3 catégories de service et 3 catégories de salaire
  • Nous avons 27 répondants avec un salaire moyen (rangée du bas, au milieu)
  • Nous avons 51 répondants avec un bon service (dernière colonne, milieu)

Maintenant, nous devons calculer les fréquences attendues: -

Les fréquences attendues peuvent être calculées à l'aide d'une formule: -

  • Pour calculer l' excellent, nous utiliserons la multiplication du total de Faible par le total de Excellent divisé par N.

Supposons que nous devions calculer pour la 1ère ligne et la 1ère colonne (= B7 * E4 / B9 ) . Cela donnera le nombre attendu de clients ayant voté Excellent service pour les salaires des personnes en attente aussi bas soit 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

De même pour tous, nous devons faire de même et la formule est appliquée dans le diagramme ci-dessous.

Nous obtenons le tableau des fréquences attendues comme indiqué ci-dessous: -

Remarque: - Supposons que le niveau de signification est de 0,05. Ici, H0 et H1 dénotent l'indépendance et la dépendance de la qualité de service vis-à-vis des salaires des personnes aux tables d'attente.

Après avoir calculé la fréquence attendue, nous calculerons les points de données du chi carré en utilisant une formule

Points du chi carré = (observé-attendu) ^ 2 / attendu

Pour calculer le premier point, nous écrivons = (B4-B14) ^ 2 / B14. 

Nous allons copier et coller la formule dans d'autres cellules pour remplir la valeur automatiquement.

Après cela, nous calculerons la valeur chi (valeur calculée) en ajoutant toutes les valeurs données au-dessus du tableau

Nous avons obtenu la valeur Chi de 18,65823 .

Pour calculer la valeur critique pour cela, nous utilisons un tableau de valeurs critiques du chi carré de nous pouvons utiliser la formule donnée ci-dessous.

Cette formule contient 2 paramètres CHISQ.INV.RT (probabilité, degré de liberté).

La probabilité est de 0,05, c'est une valeur significative qui nous aidera à déterminer s'il faut accepter ou non l' hypothèse nulle (H 0 ) .

La valeur critique du chi carré est 9,487729037.

Nous allons maintenant trouver la valeur du chi carré ou (valeur P) = CHITEST (plage_actuelle, plage_attendue)

Plage de = CHITEST (B4: D6, B14: D16) .

Comme nous l'avons vu, la valeur du test du chi ou de la valeur P est = 0,00091723.

Comme nous l'avons vu, nous avons calculé toutes les valeurs. Les valeurs du chi carré (valeur calculée) ne sont significatives que lorsque sa valeur est égale ou supérieure à la valeur critique 9,48, c'est-à - dire que la valeur critique (valeur tabulée) doit être supérieure à 18,65 pour accepter l' hypothèse nulle (H 0 ) .

Mais ici Valeur calculée > Valeur tabulée

X2 (calculé)> X2 (tabulé)

18,65> 9,48

Dans ce cas, nous rejetterons l' hypothèse nulle (H 0 ) et l' alternative (H 1 ) sera acceptée.

  • Nous pouvons également utiliser la valeur P pour prédire la même chose, c'est-à - dire si la valeur P <= α (valeur significative 0,05), l'hypothèse nulle sera rejetée
  • Si la valeur P> α , ne rejetez  pas l' hypothèse nulle .

Ici valeur P (0,0009172) < α (0,05), rejeter H 0 , accepter H 1

De l'exemple ci-dessus, nous concluons que la qualité du service dépend des salaires des personnes en attente.

Choses à retenir

  • Considère le carré d'une variable normale standard.
  • Évalue si les fréquences observées dans différentes catégories diffèrent considérablement des fréquences attendues selon un ensemble d'hypothèses spécifié.
  • Détermine l'adéquation d'une distribution supposée aux données.
  • Utilise des tableaux de contingence (dans les études de marché, ces tableaux sont appelés tableaux croisés).
  • Prend en charge les mesures de niveau nominal.