Coefficient de corrélation de Pearson

Définition du coefficient de corrélation de Pearson

Le coefficient de corrélation de Pearson, également connu sous le nom de test statistique Pearson R, mesure la force entre les différentes variables et leurs relations. Chaque fois qu'un test statistique est effectué entre les deux variables, il est toujours judicieux pour la personne effectuant l'analyse de calculer la valeur du coefficient de corrélation pour savoir à quel point la relation entre les deux variables est forte.

Le coefficient de corrélation de Pearson renvoie une valeur comprise entre -1 et 1. L'interprétation du coefficient de corrélation est la suivante:

  • Si le coefficient de corrélation est -1, cela indique une forte relation négative. Cela implique une relation négative parfaite entre les variables.
  • Si le coefficient de corrélation est égal à 0, il n'indique aucune relation.
  • Si le coefficient de corrélation est 1, cela indique une forte relation positive. Cela implique une relation positive parfaite entre les variables.

Une valeur absolue plus élevée du coefficient de corrélation indique une relation plus forte entre les variables. Ainsi, un coefficient de corrélation de 0,78 indique une corrélation positive plus forte par rapport à une valeur de, disons, 0,36. De même, un coefficient de corrélation de -0,87 indique une corrélation négative plus forte par rapport à un coefficient de corrélation de, par exemple, -0,40.

En d'autres termes, si la valeur est dans la plage positive, cela montre que la relation entre les variables est corrélée positivement et que les deux valeurs diminuent ou augmentent ensemble. D'un autre côté, si la valeur est dans la plage négative, cela montre que la relation entre les variables est corrélée négativement, et les deux valeurs iront dans la direction opposée.

Formule du coefficient de corrélation de Pearson

La formule du coefficient de corrélation de Pearson est la suivante,

Où,

  • r = coefficient de Pearson
  • n = nombre de paires du stock
  • ∑xy = somme des produits des actions appariées
  • ∑x = somme des x scores
  • ∑y = somme des scores y
  • ∑x2 = somme des scores x au carré
  • ∑y2 = somme des scores y au carré

Explication

Étape 1: Découvrez le nombre de paires de variables, qui est noté n. Supposons que x se compose de 3 variables - 6, 8, 10. Supposons que y se compose de 3 variables correspondantes 12, 10, 20.

Étape 2: Listez les variables dans deux colonnes.

Étape 3: Découvrez le produit de x et y dans la 3e colonne.

Étape 4: Découvrez la somme des valeurs de toutes les variables x et de toutes les variables y. Écrivez les résultats au bas de la 1ère et de la 2ème colonne. Écrivez la somme de x * y dans la 3e colonne.

Étape 5: Découvrez x2 et y2 dans les 4e et 5e colonnes et leur somme en bas des colonnes.

Étape 6: Insérez les valeurs ci-dessus dans la formule et résolvez-la.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Exemple de coefficient de corrélation de Pearson R

Vous pouvez télécharger ce modèle Excel de coefficient de corrélation de Pearson ici - Modèle Excel de coefficient de corrélation de Pearson

Exemple 1

Dans cet exemple à l'aide des détails suivants dans le tableau des 6 personnes ayant un âge différent et des poids différents donnés ci-dessous pour le calcul de la valeur du Pearson R

Solution:

Pour le calcul du coefficient de corrélation de Pearson, nous allons d'abord calculer les valeurs suivantes,

Ici, le nombre total de personnes est de 6 donc, n = 6

Maintenant, le calcul du Pearson R est le suivant,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622- 82618) / (√ [43680-40804] * [170190-167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Ainsi, la valeur du coefficient de corrélation de Pearson est de 0,35

Exemple # 2

Il y a 2 actions - A et B.Les cours de leurs actions à certains jours sont les suivants:

Découvrez le coefficient de corrélation de Pearson à partir des données ci-dessus.

Solution:

Tout d'abord, nous calculerons les valeurs suivantes.

Le calcul du coefficient de Pearson est le suivant,

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Par conséquent, le coefficient de corrélation de Pearson entre les deux actions est de -0,9088.

Avantages

  • Cela aide à connaître la force de la relation entre les deux variables. Non seulement la présence ou l'absence de corrélation entre les deux variables est indiquée à l'aide du coefficient de corrélation de Pearson, mais elle détermine également la mesure exacte dans laquelle ces variables sont corrélées.
  • En utilisant cette méthode, on peut déterminer le sens de corrélation, c'est-à-dire si la corrélation entre deux variables est négative ou positive.

Désavantages

  • Le coefficient de corrélation de Pearson R n'est pas suffisant pour faire la différence entre les variables dépendantes et les variables indépendantes car le coefficient de corrélation entre les variables est symétrique. Par exemple, si une personne essaie de connaître la corrélation entre le stress élevé et la pression artérielle, alors on peut trouver la valeur élevée de la corrélation qui montre qu'un stress élevé provoque la pression artérielle. Maintenant, si la variable est inversée, le résultat, dans ce cas, sera également le même, ce qui montre que le stress est causé par la pression artérielle, ce qui n'a aucun sens. Ainsi, le chercheur doit être conscient des données qu'il utilise pour mener l'analyse.
  • En utilisant cette méthode, on ne peut pas obtenir les informations sur la pente de la ligne car elle indique seulement si une relation entre les deux variables existe ou non.
  • Il est probable que le coefficient de corrélation de Pearson soit mal interprété, en particulier dans le cas des données homogènes.
  • Comparée aux autres méthodes de calcul, cette méthode prend beaucoup de temps pour arriver aux résultats.

Les points importants

  • Les valeurs peuvent aller de la valeur +1 à la valeur -1, où le +1 indique la relation positive parfaite entre les variables considérées, le -1 indique la relation négative parfaite entre les variables considérées et une valeur 0 indique qu'aucune relation existe entre les variables considérées.
  • Il est indépendant de l'unité de mesure des variables. Par exemple, si l'unité de mesure d'une variable est en années tandis que l'unité de mesure de la deuxième variable est en kilogrammes, même alors, la valeur de ce coefficient ne change pas.
  • Le coefficient de corrélation entre les variables est symétrique ce qui signifie que la valeur du coefficient de corrélation entre Y et X ou X et Y, restera la même.

Conclusion

Le coefficient de corrélation de Pearson est le type de coefficient de corrélation qui représente la relation entre les deux variables mesurées sur le même intervalle ou sur la même échelle de rapport. Il mesure la force de la relation entre les deux variables continues.

Il indique non seulement la présence ou l'absence de corrélation entre les deux variables, mais il détermine également le degré exact de corrélation de ces variables. Il est indépendant de l'unité de mesure des variables où les valeurs du coefficient de corrélation peuvent aller de la valeur +1 à la valeur -1. Cependant, il ne suffit pas de faire la différence entre les variables dépendantes et les variables indépendantes.