FICHE MÉTHODE : CORRÉLATION ET CAUSALITÉ


Pour commencer : "Les corrélations", chronique de P. Cohen, Le "7 - 9", France Inter, 29/10/2015

Activité 1 : Écoutez le document audio ci-dessous et répondez au fur et à mesure aux différentes questions.

I/ Qu'est ce qu'une corrélation ? Qu'est ce qu'une causalité ? Comment les distinguer ?

1.1. Pour commencer : Document vidéo : "Corrélation, chocolat et moustache de chat", La statistique expliquée à mon chat, mai 2016.

Activité 2 : Regardez la vidéo ci-dessous et répondez aux questions au fur et à mesure. Prenez des notes sur les éléments qui vous apparaissent essentiels.

1.2. Quelques éléments à retenir.

    Pour argumenter, il est souvent utile de s'appuyer sur l'existence de liens statistiques entre 2 phénomènes, soit pour confirmer une théorie, soit pour la contredire ou la nuancer.
    Ce lien statistique entre deux variables s'appelle une corrélation entre 2 variables X et Y.
    Le plus souvent, c'est à partir d'une représentation graphique que l'on met en évidence l'existence, ou l'absence, d'une corrélation entre 2 variables ainsi que la nature de cette corrélation. Cette représentation graphique prend (souvent, mais pas seulement) la forme d'un nuage de points dont les coordonnées sont les valeurs prises par la variable X (sur l'axe des abscisses) et par la variable Y (sur l'axe des ordonnées).
    Le nuage de points obtenu peut être approché par une droite (dite droite des moindres carrés ou droite de régression linéaire) dont le profil et la pente renseignent sur la présence et le sens de la corrélation : plus les différents points sont proches ("alignés") de la droite et plus la corrélation est forte.
    On peut alors distinguer trois situations :

Exemple 1 : Nombre de prix Nobel obtenus en fonction de la quantité de chocolat consommée par pays
Corrélation positive
Situation 1 : une corrélation positive.

Les deux variables varient dans le même sens (lorsqu’une variable augmente, l’autre augmente également ; ou lorsqu’une variable diminue, l’autre diminue également).
Dans l'exemple 1 ci-contre,on observe bien que plus la consommation de chocolat s’accroît, et plus le nombre de prix Nobel obtenus augmente. C'est donc bien une corrélation positive (pente de la droite positive).
Exemple 2 : Score à un test de dextérité en fonction du nombre de verres d'alcool bus par un individu
Corrélation négative
Situation 2 : une corrélation négative.

Les deux variables varient en sens inverse (lorsqu’une variable augmente, l’autre diminue).
Dans l'exemple 2 ci-contre, plus le nombre de verres consommés augmente, plus la dextérité diminue. C'est donc bien une corrélation négative (pente de la droite négative)
Exemple 3 : Lien entre la longitude d'une ville et le nombre de lettres constituant son nom
Corrélation nulle
Situation 3: une absence de corrélation.

Lorsqu’une variable varie, l’autre ne varie pas, ou alors varie sans lien avec la première (les variables sont indépendantes l'une de l'autre). Les différents points sont particulièrement dispersés sur le graphique, éloignés de la droite.
Dans l'exemple 3 ci-contre, il n'y a aucun lien entre les deux variables. Il n'y a donc pas de corrélation (celle-ci est nulle, la droite est horizontale ou presque horizontale)

    Une corrélation exprime-t-elle toujours une causalité ?

    Une causalité (ou relation de causalité) correspond à la responsabilité, explicable par un mécanisme théorique, de la valeur de X dans la valeur prise par Y. Autrement dit, X est la cause de Y si il est possible de rendre compte des raisons qui font que, X variant, Y varie également. Il y a alors relation de cause à effet (la variation de X est la cause de la variation de Y).

Ainsi, si une corrélation peut être le signe d'une causalité, ce n'est pas toujours le cas. Il peut par exemple exister ...
 ... corrélation et causalité Dans l'exemple 2 ci-dessus, il semble certain qu'il y a causalité : la consommation d'alcool augmentant, les réflexes s'émoussent, l'individu est de moins en moins habile, il perd en dextérité. C'est bien l'alcool qui est responsable de cet état. Il y a donc à la fois corrélation et causalité.
... corrélation mais absence de causalité entre les deux variables (rôle d'une variable cachée) Dans l'exemple 1, comme nous l'avons vu, s'il y bien corrélation, il n'y a pas causalité : consommer du chocolat ne rend pas plus intelligent (ce qui se traduirait par un plus grand nombre de prix Nobel). C'est l'existence d'une variable "cachée" (une troisième variable qui influence la variable X et la variable Y) qui conduit à une corrélation qui suggère une causalité. Cette variable, la richesse d'un pays mesuré par son revenu par habitant, est tout à la fois la cause de la consommation de chocolat (variable X : le chocolat est un produit de luxe, cher, d'autant plus accessible que les revenus sont élevés) et la cause du nombre de prix Nobel obtenus (variable Y : un pays riche peut consacrer plus de moyens à son système éducatif pour le rendre plus performant qu'un pays pauvre).
... corrélation et causalité, mais on ne sait pas quel est le sens de la causalité Corrélation PIB et CF
Dans l'exemple ci-contre, on observe une corrélation très nette entre la croissance des dépenses de consommation des ménages et la croissance du PIB par habitant.
Mais quelle est la causalité ?
En effet cette corrélation peut traduire tout aussi bien :
1) l'impact causal de la croissance des dépenses de consommation sur la croissance du PIB ("plus de dépenses de consommation, donc plus de débouchés, donc plus de production")
ou
2) l'impact causal de la croissance du PIB sur la croissance des dépenses de consommation ("plus de PIB, donc plus de richesses crées, donc plus de revenus, donc plus de dépenses de consommation")
ou
3) l'impact causal des deux à la fois

Conclusion : Attention, les apparences sont parfois trompeuses. Il faut donc se montrer très prudent dans l'analyse de ce type de graphique, faire preuve de bon sens et bien prendre le temps de réfléchir ....


II/ EXERCICES

Activité 3 : "Faites parler les données", Cité de l’Économie et de la Monnaie.

Consigne : Quatre indicateurs de développement économique et social (collectés par la Banque Mondiale) vous sont proposés. Sélectionnez deux de ces indicateurs, à votre choix. Observez le graphique qui se dessine à l’écran. Les deux indicateurs évoluent-ils dans le même sens ? Ou dans des sens opposés ? Ou évoluent-ils, au contraire, indépendamment l’un de l’autre ? Mais, si deux indicateurs sont corrélés, cela veut-il toujours dire que l’un influence l’autre ? Plusieurs solutions vous sont proposées et des réponses détaillées sont fournies.

!! Remarque : il faut recommencer plusieurs fois l'activité en changeant d'indicateurs !!

Pour commencer, cliquer sur l'image ci-dessous.

Activité 3


Activité 4 : Répondez aux questions de l'exercice ci-dessous

!! Attention :  il peut y avoir une ou plusieurs bonnes réponses. Tant que vous ne répondez pas correctement, vous ne pouvez pas passer à la question suivante !!



Activité 5 : Pour terminer, entraînez vous à la 2éme partie de l’Épreuve Composée

Sujet : Vous présenterez le document puis vous vous interrogerez sur la relation qu'il met en évidence

Emplois dans la haute technologie et PIB
Source
: "Une approche de la  haute technologie dans le Nord-Pas-de-Calais", INSEE Profils Nord-Pas-de-Calais, N°4, avril 2002

Remarque : vous pouvez répondre en complétant le Pad ci-dessous :