Outil d'analyse dans Excel

Outil d'analyse de données Excel

L'outil d'analyse de données dans Excel est un addin dans Excel qui nous permet de faire l'analyse de données et divers autres calculs importants, cet addin n'est par défaut pas activé dans Excel et nous devons l'activer manuellement à partir de l'onglet Fichiers dans la section des options, puis dans la section addins, nous cliquons sur gérer les addins puis vérifions le toolpak d'analyse pour l'utiliser dans Excel.

Procédure de chargement du complément de l'outil d'analyse de données

  • Étape 1 - Cliquez sur «Fichier».

  • Étape 2 -  Cliquez sur «Options» dans la liste.

  • Étape 3 -  Cliquez sur «Compléments» , puis choisissez «Compléments Excel» pour «Gérer» . Cliquez sur «Go».

  • Étape 4 -  La boîte de dialogue «Compléments Excel» apparaîtra avec la liste des compléments. Veuillez cocher «Analysis ToolPak»  et cliquer sur «OK» .

  • Étape 5 - La commande «Analyse des données» apparaîtra sous l' onglet «Données» dans Excel à l'extrême droite du ruban comme affiché ci-dessous.

Liste des fonctions disponibles dans Excel Data Analysis ToolPak

Vous trouverez ci-dessous la liste des fonctions disponibles dans le complément Excel de l'outil d'analyse:

  1. ANOVA: facteur unique dans Excel
  2. Corrélation dans Excel
  3. Rang et centile dans Excel
  4. Statistiques descriptives dans Excel

Parlons maintenant de chacun d'eux en détail -

# 1 - ANOVA: facteur unique dans Excel

ANOVA signifie Analysis of Variance et est le premier ensemble d'options disponibles dans le complément Excel Analysis Toolpak. D'une manière ANOVA, nous analysons s'il existe des différences statistiques entre les moyennes de trois groupes indépendants ou plus. L'hypothèse nulle propose qu'aucune signification statistique n'existe dans un ensemble d'observations données. Nous testons cette hypothèse en vérifiant la valeur p.

Comprenons cela par un excellent exemple ANOVA.

Exemple

Supposons que nous ayons les données suivantes issues de l'expérience menée pour vérifier «La maîtrise de soi peut-elle être rétablie pendant l'intoxication? Nous avons classé 44 hommes en 4 groupes égaux comprenant 11 hommes dans chaque groupe.

  • Le groupe A a reçu 0,62 mg / kg d'alcool.
  • Le groupe AC a reçu de l'alcool plus de la caféine.
  • Le groupe AR a reçu de l'alcool et une récompense monétaire pour sa performance.
  • Le groupe P a reçu un placebo.

Les scores sur la tâche d'achèvement de la tige d'attribution impliquant des «processus de mémoire contrôlés (avec effort)» ont été enregistrés et le résultat est le suivant:

Nous devons tester l'hypothèse nulle qui propose que toutes les moyennes sont égales (il n'y a pas de différence significative).

Comment exécuter le test ANOVA?

Pour exécuter le test unidirectionnel ANOVA, nous devons effectuer les étapes suivantes:

  • Étape 1: Cliquez sur la commande «Analyse des données» disponible dans l' onglet «Données» sous «Analyse».

  • Étape 2: Sélectionnez «Anova: Single Factor» dans la liste et cliquez sur «OK».

  • Étape 3: Nous obtenons la boîte de dialogue «Anova: Single Factor» . Nous devons sélectionner la plage d'entrée comme données avec en-tête de colonne.

  • Étape 4: Comme nous avons pris les en-têtes de colonnes dans notre sélection, nous devons cocher la case «Étiquettes dans la première ligne».

  • Étape 5: Pour la plage de sortie, nous avons sélectionné F1. Veuillez cliquer sur «OK» .

Nous avons maintenant une analyse ANOVA.

Plus la valeur de la statistique F dans Excel est élevée, plus il est probable que les groupes aient des moyennes différentes qui rejettent l'hypothèse nulle selon laquelle toutes les moyennes sont égales. Une statistique F supérieure à la valeur critique équivaut à une valeur p dans excel inférieure à alpha et les deux signifient que nous rejetons l'hypothèse nulle. Par conséquent, il est conclu qu'il existe une différence significative entre les groupes.

# 2 - Corrélation dans Excel

La corrélation est une mesure statistique disponible dans le complément Excel de Analysis Toolpak et indique dans quelle mesure deux variables ou plus fluctuent ensemble. Une corrélation positive dans Excel indique la mesure dans laquelle ces variables augmentent ou diminuent en parallèle et une corrélation négative indique la mesure dans laquelle une variable augmente à mesure que l'autre diminue.

Vous pouvez télécharger ce modèle Excel de l'outil d'analyse ici - Modèle Excel de l'outil d'analyse
Exemple

Nous disposons des données suivantes relatives aux frais publicitaires et aux ventes d'une entreprise. Nous voulons découvrir la relation entre les deux afin de pouvoir planifier en conséquence notre budget et espérer des ventes (objectif fixé en tenant compte d'autres facteurs également).

Comment trouver la corrélation entre deux ensembles de variables?

Pour connaître la corrélation entre ces deux ensembles de variables, nous suivrons les étapes ci-dessous:

  • Étape 1: Cliquez sur «Analyse des données» sous le groupe «Analyse» disponible dans «Données».

  • Étape 2: Choisissez «Corrélation» dans la liste et cliquez sur «OK» .

  • Étape 3: Choisissez la plage '$ A $ 1: $ B $ 16' comme plage d'entrée et $ F $ 1 comme plage de sortie. Veuillez cocher la case "Libellés dans la première ligne" car nous avons des en-têtes de colonne dans notre plage d'entrée et comme nous avons des en-têtes différents dans une colonne différente. Nous avons choisi «Colonnes» pour «Groupé par» .

  • Étape 4: Sélectionnez la plage de sortie puis cliquez sur 'OK'.

  • Nous obtenons le résultat.

Comme nous pouvons le voir, la corrélation entre le coût de la publicité (en-tête de colonne) et les ventes (en-tête de ligne) est de +0,86274 environ. ce qui indique qu'ils ont une corrélation positive et à 86,27%. Nous pouvons désormais prendre une décision sur le budget publicitaire et les ventes attendues.

# 3 - Rang et centile dans Excel

Le centile dans Excel fait référence à un nombre dans lequel un certain pourcentage de scores tombe en dessous de ce nombre et est disponible dans le complément Excel de l'outil d'analyse. Par exemple, si un score particulier se situe dans le 90e centile, cela signifie que l'élève a obtenu un meilleur score que 90% des personnes qui ont passé le test. Comprenons cela avec un exemple.

Exemple

Nous avons les données suivantes pour les scores obtenus par un élève d'une classe.

Nous voulons connaître le rang et le centile de chaque élève.

Comment trouver le rang et le centile?

Les étapes seraient:

  • Étape 1: Cliquez sur «Analyse des données» sous le groupe «Analyse» disponible dans «Données».

  • Étape 2: Cliquez sur «Rang et centile» dans la liste, puis cliquez sur «OK» .

  • Étape 3: Sélectionnez «$ B $ 1: B $ B $ 17» comme plage d'entrée et «$ D $ 1» comme plage de sortie.

  • Étape 4: Comme nous avons des têtes de champ de données dans des colonnes, c'est-à-dire que les données sont regroupées en colonnes, nous devons sélectionner «Colonnes» pour «Groupé par» .

  • Étape 5: Nous avons choisi la colonne rubrique également dans notre gamme d'entrée qui est la raison pour laquelle nous avons besoin de vérifier les « étiquettes dans la première rangée » puis cliquez sur « OK ».

  • Nous avons obtenu le résultat comme l'image suivante.

# 4 - Statistiques descriptives dans Excel

Les statistiques descriptives incluses dans le complément Excel de l'outil d'analyse contiennent les informations suivantes sur un exemple:

  1. Tendance centrale
    1. Mean: Cela s'appelle la moyenne.
    2. Médiane: C'est le point médian de la distribution.
    3. Mode: C'est le nombre le plus fréquent.
  2. Mesures de variabilité
    1. Plage: il s'agit de la différence entre les variables les plus grandes et les plus petites.
    2. Variance: Ceci indique dans quelle mesure les nombres sont répartis.
    3. Écart type: quelle est la variation par rapport à la moyenne / moyenne
  3. Skewness: Ceci indique la symétrie de la distribution d'une variable.
  4. Kurtosis: Ceci indique le pic ou la planéité d'une distribution.
Exemple

Ci-dessous, nous avons les notes des étudiants en économie. Nous voulons découvrir des statistiques descriptives.

Pour faire de même, les étapes sont:

  • Étape 1: Cliquez sur la commande 'Analyse des données' disponible dans le groupe 'Analyse' dans 'Données'.

  • Étape 2: Choisissez «Statistiques descriptives» dans la liste et cliquez sur «OK».

  • Étape 3: Choisissez '$ A $ 1: $ A $ 15' comme plage d'entrée, choisissez 'Colonnes' pour ' Groupé par' , cochez 'Étiquettes dans la première ligne' ,

  • Étape 4: Choisissez «$ C $ 1» comme plage de sortie et assurez-vous que nous avons coché la case «Statistiques récapitulatives» . Cliquez sur «OK».

Maintenant, nous avons nos statistiques descriptives pour les données.