Formule aberrante

La formule aberrante fournit un outil graphique pour calculer les données qui sont situées à l'extérieur de l'ensemble donné de distribution qui peut être du côté intérieur ou extérieur en fonction des variables.

Quelle est la formule aberrante?

Une valeur aberrante est le point de données de l'échantillon donné ou de l'observation donnée ou dans une distribution qui doit se trouver en dehors du modèle global. Règle couramment utilisée qui indique qu'un point de données sera considéré comme une valeur aberrante s'il a plus de 1,5 IQR en dessous du premier quartile ou au-dessus du troisième quartile.

Autrement dit, les valeurs aberrantes basses doivent être inférieures à Q1-1,5 IQR et les valeurs aberrantes élevées doivent se situer Q3 + 1,5IQR

Il faut calculer la médiane, les quartiles comprenant IQR, Q1 et Q3.

La formule aberrante est représentée comme suit,

La formule pour Q1 = ¼ (n + 1) e terme La formule pour Q3 = ¾ (n + 1) e terme La formule pour Q2 = Q3 - Q1

Calcul étape par étape des valeurs aberrantes

Les étapes ci-dessous doivent être suivies pour calculer la valeur aberrante.

  • Étape 1: Calculez d'abord les quartiles, c'est-à-dire Q1, Q2 et interquartile
  • Étape 2: Calculez maintenant la valeur Q2 * 1,5
  • Étape 3: Soustrayez maintenant la valeur Q1 de la valeur calculée à l'étape 2
  • Étape 4: Ajoutez ici Q3 avec la valeur calculée à l'étape 2
  • Étape 5: Créez la plage des valeurs calculées aux étapes 3 et 4
  • Étape 6: Organisez les données par ordre croissant
  • Étape 7: Vérifiez s'il existe des valeurs inférieures ou supérieures à la plage créée à l'étape 5

Exemple

Considérez un ensemble de données de nombres suivants: 10, 2, 4, 7, 8, 5, 11, 3, 12. Vous devez calculer toutes les valeurs aberrantes.

Solution:

Tout d'abord, nous devons organiser les données par ordre croissant pour trouver la médiane qui sera pour nous Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Maintenant que le nombre d'observations est impair qui est de 9, la médiane se situerait sur une 5ème position qui est de 7 et la même chose sera Q2 pour cet exemple.

Par conséquent, le calcul de Q1 est le suivant -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 sera - 

Q1 = 2,5 terme

Cela signifie que Q1 est la moyenne de la 2ème et 3ème position des observations qui sont ici 3 & 4 et une moyenne de la même chose est (3 + 4) / 2 = 3,5

Par conséquent, le calcul de Q3 est le suivant -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 sera - 

Q3 = 7,5 terme

Cela signifie que Q3 est la moyenne de la 7ème et 8ème position des observations qui est ici 10 & 11 et une moyenne de la même chose est (10 + 11) / 2 = 10.5

Désormais, les valeurs aberrantes basses doivent être inférieures à Q1-1.5IQR et les valeurs aberrantes élevées doivent se situer à Q3 + 1,5IQR

Ainsi, les valeurs sont 3,5 - (1,5 * 7) = -7 et la plage supérieure est 10,5 + (1,5 * 7) = 110,25.

Puisqu'il n'y a aucune observation qui se situe au-dessus ou en dessous de 110,25 et -7, nous n'avons pas de valeurs aberrantes dans cet échantillon.

Exemple de formule aberrante dans Excel (avec modèle Excel)

Vous pouvez télécharger ce modèle Excel de formule aberrante ici - Modèle Excel de formule aberrante

Les cours de coaching créatif envisagent de récompenser les étudiants qui sont dans le top 25%, mais ils veulent éviter les valeurs aberrantes. Les données concernent les 25 étudiants. Utilisez l'équation des valeurs aberrantes pour déterminer s'il existe une valeur aberrante?

Solution:

Vous trouverez ci-dessous des données pour calculer les valeurs aberrantes

Le nombre d'observations ici est de 25 et notre première étape consisterait à convertir les données brutes ci-dessus par ordre croissant.

La médiane sera -

La valeur médiane = ½ (n + 1)

= ½ = ½ (26)

= 13e terme

Le Q2 ​​ou médiane est de 68,00

Ce qui représente 50% de la population.

Q1 sera -

Q1 = ¼ (n + 1) e terme

= ¼ (25 + 1)

= ¼ (26)

= 6,5e terme qui équivaut au 7e terme

Le Q1 est de 56,00 ce qui est le plus bas 25%

Q3 sera -

Enfin, Q3 = ¾ (n + 1) ème terme

= ¾ (26)

= 19,50 terme

Ici, la moyenne doit être prise qui est des 19e et 20e trimestres qui sont 77 et 77 et la moyenne de même est (77 + 77) / 2 = 77,00

 Le Q3 est 77 qui est le top 25%

Bas de gamme

Désormais, les valeurs aberrantes basses doivent être inférieures à Q1-1.5IQR et les valeurs aberrantes élevées doivent se situer à Q3 + 1,5IQR

Haut de gamme -

Ainsi, les valeurs sont 56 - (1,5 * 68) = -46 et la plage supérieure est 77 + (1,5 * 68) = 179.

Il n'y a pas de valeurs aberrantes.

Pertinence et utilisations

Il est très important de connaître la formule des valeurs aberrantes car il pourrait y avoir des données qui seraient faussées par une telle valeur. Prenons un exemple des observations 2, 4, 6, 101 et maintenant si quelqu'un prend une moyenne de ces valeurs, elle sera de 28,25 mais 75% des observations se situent en dessous de 7 et par conséquent, une décision serait incorrecte concernant les observations de cet échantillon.

On peut remarquer ici que 101 semble clairement décrire et si cela est supprimé, la moyenne serait de 4, ce qui indique que les valeurs ou les observations se situent dans la plage de 4. Par conséquent, il est très important d'effectuer ce calcul pour éviter toute mauvaise utilisation des informations principales des données. Ces derniers sont largement utilisés par les statisticiens du monde entier lorsqu'ils mènent des recherches.