Illusion de causalité
L’illusion de causalité consiste à percevoir une cause entre deux variables corrélées or une corrélation ne signifie pas toujours une causalité.
Qu'est-ce que l'illusion de causalité ?
L'illusion de causalité consiste à percevoir une cause entre deux variables corrélées. Cette notion de corrélation, autrement dit quand 2 données semblent liées, est tout à fait différente de celle de causalité, le lien de cause à effet. C'est aussi la source de nombreuses confusions et erreurs. Nous comprenons aisément que pour de mauvaises intentions, il est très facile d'utiliser les corrélations. Corrélation ne se traduit pas par causalité. La véritable cause de l'effet peut tout simplement ne pas être prise en compte. De plus, lorsqu’une corrélation nous ai présenté, elle peut générer un biais de cadrage. Le biais de cadrage est la tendance à être influencé par la manière dont un problème est présenté. Spurious correlations est le nom du projet de Tyler Vigen. A travers de nombreux jeux de données à sa disposition, il superpose des univers qui n'ont absolument aucun rapport les uns avec les autres. Pourtant, les sets de données sont corrélés, et de manière univoque. Pour certains exemples la corrélation est même de 99%, et cela est vraiment troublant.
Quand les corrélations deviennent une arme de défense
L'industrie du tabac
Dans les années 70, de nombreux chercheurs commençaient à pointer du doigt l'industrie du tabac, en corrélant le nombre important de cancers du poumon avec les fumeurs. Pour les chercheurs, le tabac était l'une des causes principales à l'origine du cancer des poumons. Cette période fut donc délicate pour l'industrie du tabac et les intérêts économiques des grandes marques. Pour riposter, les principaux fabricants de tabac se sont unis pour créer leur propres laboratoires de recherche, et pour contre argumenter leurs adversaires. Quand nous cherchons, nous trouvons. De nombreux exemples de corrélations ont donc été trouvés, dans le but d'occuper l'espace et les médias, de troubler l'opinion, et de gagner du temps. Le seul objectif de ces travaux fût de contrer leurs adversaires et de minimiser l'effet du tabac sur la santé aux yeux du grand public.
Conclusion
A travers le projet Spurious correlations, Tyler nous montre, indirectement et de manière caricaturale, que des données corrélées peuvent être à la source de nombreuses dérives. La moralité est qu'une corrélation est une piste à creuser et qu'il faut investiguer davantage pour démontrer une causalité, sans tomber dans les pièges. Or, cela est synonyme de temps, ce qui n'est pas toujours compatible avec le système de pensée "rapide" décrit par le modèle théorique de Kahneman.
Exemple de corrélation de Tyler Vigen
Cet exemple de Tyler VIGEN affiche une corrélation de 99.26% entre la baisse des divorces et la baisse de la consommation de margarine dans l'état du Maine aux Etats-Unis sur une période de 10 années. Les sources des données sont communiquées en bas de page. Puis-je conclure qu'en consommant moins de margarine, j'ai moins de chance de divorcer ? Puis-je extrapoler en concluant que la margarine impacte négativement l'entente au sein d'un couple ? Nous pouvons dire tout et surtout n'importe quoi, en étant parfois sous couvert et légitimé par des statistiques et des sources pourtant bien réelles. Car dans cet exemple, les données sont réelles, sourcées, la période de l'observation est longue, et le coefficient de corrélation très fort. C'est ainsi que commence les illusions et parfois la malhonnêteté pour faire commerce de ses idées.
Sources et liens en relation avec l'article
U.S. National Center for Health Statistics, National Vital Statistics Reports.