Causaliteit is een principe binnen de statistiek dat vaak op een verkeerde wijze wordt gebruikt en geïnterpreteerd door niet-specialisten. Verschillende media, politici en lobby groepen halen regelmatig correlaties uit onderzoeken aan als direct bewijs voor hun eigen standpunten. Waar zij echter de fout in gaan is dat ondanks dat variabelen een bepaalde samenhang lijken te vertonen, dit geen rechtstreeks bewijs is van onderliggende causaliteit.

 

 

Correlatie en causaliteit

Wat houdt de term correlatie eigenlijk in? Een correlatie houdt in dat twee variabelen op een ordelijke manier een bepaalde samenhang vertonen. Echter, een correlatie betekent niet hetzelfde als causaliteit (i.e. oorzaak-gevolg relatie). In andere woorden, correlaties vertellen ons niet of er een oorzaak en gevolg relatie tussen twee variabelen bestaat.

Bijvoorbeeld, het kan voor een onderzoeker interessant zijn om te weten of de tijd die 16 jarige jongens gemiddeld besteden aan het spelen van een first-person shooter (e.g. Battlefield) gecorreleerd is aan agressief gedrag op school. Een correlatie tussen de tijd besteed aan het spelen van een first-person shooter en agressief gedrag, is een indicator voor de wijze waarop de twee variabelen gecorreleerd zijn en hoe sterk. Het is belangrijk om te weten dat een correlatie tussen deze twee variabelen een onderzoeker niet laat zien of de tijd die besteed wordt aan het spelen van een first-person shooter daadwerkelijk agressief gedrag op school veroorzaakt.

Patronen van causaliteit in ons brein

Het menselijk brein is gebouwd om onbewust connecties te leggen tussen vele verschillende contrasterende stukken informatie. Ons brein probeert vaak om patronen te vinden in willekeurige data, verbindt hier vervolgens een conclusie aan, en gaat er van uit dat er een relatie aanwezig is (Batten, 2009). Het overwinnen van deze neiging is een belangrijk onderdeel binnen een academische studie, zoals psychologie. De bekwaamheid om data objectief te evalueren is niet alleen essentieel voor academisch succes, maar voor iedereen die kritisch denken hoog in het vaandel heeft staan.

IJsjesstrand

Een tekstboek voorbeeld waarbij er wel een correlatie aanwezig is, maar waarbij er geen sprake van een causaal verband is: als er meer ijsjes worden verkocht (variabele X) dan stijgt het aantal verdrinkingen (variabele Y).

Er zijn een aantal problemen met betrekking tot dit voorbeeld. Het eerste probleem is dat correlaties ook andersom kunnen gelden, in dit geval: het aantal verkochte ijsjes stijgt naarmate er meer verdrinkingen zijn. Het is echter veel aannemelijker dat we een derde variabele, een zogenaamde ‘confouding variable’, over het hoofd hebben gezien. Een confounding variable is een variabele buiten het bestaande model, die (positief of negatief) correleert met zowel de afhankelijke als de onafhankelijke variabele. In dit specifieke voorbeeld is dat de buiten temperatuur (variabele Z). Als het namelijk lekker warm weer buiten is (i.e. hoge temperatuur), dan zal er meer ijs verkocht worden en zullen er meer mensen gaan zwemmen, wat tot een hoger aantal verdrinkingen zal leiden in vergelijking met wanneer het koud buiten is (e.g. winter). Samengevat, het aantal verkochte ijsjes en het aantal verdrinkingen zijn beide symptomen van een stijgende buitentemperatuur en het is tevens mogelijk dat er geen directe samenhang tussen de variabelen X en Y bestaat.grafiek erik

Sensatiezucht in de media

In de onderstaande grafiek is duidelijk te zien dat de sterke wereldwijde afname van het aantal piraten over de laatste 180 jaar leidt tot een stijging van de gemiddelde temperatuur op de aarde. Ergo, als je dus de opwarming van de aarde tot een stilstand wilt brengen, dan is het beste wat je kan doen een piraat worden.

grafiek 2 erik

Hoe onwaarschijnlijk bovenstaand voorbeeld ook mag lijken, het is een extreem voorbeeld van de incorrecte logica waar we dagelijks mee geconfronteerd worden door de media.

Wanneer onderzoeksresultaten in de media gepubliceerd worden, zijn deze vaak op een onduidelijke of misleidende manier beschreven. Denk bijvoorbeeld aan pakkende titels die op nieuwswebsites zoals ‘Nu.nl’ gebruikt worden om onze aandacht te grijpen (e.g. “Bewegen helpt niet tegen kerstkilo’s”). Helaas komen de titels van de artikelen regelmatig niet overeen met het onderzoek waar deze op gebaseerd zijn. In de praktijk betekent dit dat de titels een causale relatie kunnen suggereren, terwijl uit nadere inspectie van het artikel blijkt dat het onderzoek correlationeel van aard was (e.g. “Murderrates affect IQ tests scores: study”). In deze gevallen is de titel niet gerechtvaardigd.

Blijf kritisch

Sta bij het eerstvolgende bericht met een sensationele titel, die betrekking heeft op een onderzoek eens stil bij de principes van correlatie en causaliteit. Is het bericht waarin deze onderzoeksresultaten gepresenteerd worden gedetailleerd genoeg, en kan je zodoende eruit opmaken of het om een correlationeel onderzoek of experimenteel (i.e. causaal) onderzoek gaat? Indien de berichtgeving te summier is, probeer dan zelf de bron te achterhalen en te lezen zodat je voor jezelf kan bepalen of je de vertaalslag van het feitelijke onderzoek naar de berichtgeving accuraat vindt!

References

Batten D. F. (2009). Changing our brains: Systemic causality in complex human systems. Proceedings of the 18th Conference on Behavior representation in modeling and simulation, Sundance, UT, 31 March–2 April, pp. 9–14 top-zaymov.ru.

Nu.nl (2013). Bewegen helpt niet tegen kerstkilo’s. Retrieved December 11, 2013, from http://www.nu.nl/gezondheid/3640266/bewegen-helpt-niet-kerstkilos.html

Reuters (2010). Murder rates affect IQ tests scores: study. Retrieved December 11, 2013, from http://www.reuters.com/article/2010/06/14/us-violence-children-idUSTRE65D5VW20100614

Venganza (2013). Open letter to Kansas school board[Graph]. Retrieved December 11, 2013, from http://www.venganza.org/about/open-letter/

10 comments

    1. Exact. Mensen met adhd hebben andere hersenen (in de orde van procenten) dan mensen zonder adhd. Dus ADHD is een hersenaandoening. Een professor (nota bene) psychologie trekt deze ‘conclusie’.

      Vaak is causaliteit juist te ontkrachten met precies dezelfde meetset die de correlatie aantoont. Mensen met adhd maar niet-adhd hersenen en vice versa tonen tenminste aan dat of de adhd diagnose niet waterdicht is en/of het causale verband niet bestaat. De gemiddeldenobsessie frustreert een dergelijke kritisch blik op de meetdata.

  1. Hallo Erik, Ik ben op zoek naar een voorbeeld van een causaal verband, niet op het natuurkundige of scheikundige gebied. Dit lijkt in eerste aanleg wellicht een gek verzoek. Toch wil ik je vragen of jij een voorbeeld hebt. Inderdaad, ik ben al lang op zoek maar ik begin te geloven dat dat niet bestaat, om de simpele reden dat de intermedierende variabele altijd aanwezig is. Heb jij zo’n voorbeeld? Ik ben benieuwd

    1. Om het voorbeeld van ijsjes te gebruiken. Het verband tussen temperatuurstijging en de toename in ijsjesverkoop is zowel causaal als correlatief.

      De uiteindelijk fout zit in het generaliseren van causale verbanden. Ander voorbeeld. A: Als ik buiten in de regen sta dan word ik nat. B: Als ik in een zwembad spring dan word ik nat. Conclusie: bij zowel A als B word ik nat dus A=B. Zowel A als B zijn causale verbanden maar er is geen enkele correlatie tussen A en B.

    2. Ik weet niet zeker of ik causaal begrijp.
      Maar is het zo: als de kippen op stok zitten.
      Is het gevolg dat ze niet op de grond zitten.
      Is dit ook causaal maar dan heel simpel.
      Maar zitten ze niet op de grond hoeven ze niet op stok te zitten

    3. In de eerste 20 pagina’s van Weinberg: introduction to general systems thinking (online “leen” versie: https://archive.org/details/introductiontoge00gera ), wordt uitgelegd, wanneer je welke causale verbanden (zonder intermedierende variabele) als kloppend kan ervaren, en wanneer niet meer. Met andere woorden wanneer “verschijnen” intermedierende variabelen, wanneer verdwijnen ze weer .. Volgens Weinberg hangt het samen met complexiteit & randomness. Waarnemen en meten. Goede nieuws – er zijn voorbeelden. slechte nieuws- ze zijn niet eeuwig durend. De filosoof Henry Nelson Goodman heeft deze paradox van het niet eeuwig durend zijn- met zijn verhandelling over “Grue” proberen toe te lichten!

  2. Tja, de afname van het aantal piraten valt samen met de stijging in temperatuur. En hoe meer brandweerlieden een vuur bestrijden, hoe groter het wordt. Het 1e voorbeeld laat zich verklaren door steeds snellere en beter communicatie, technologische ontwikkeling, economische groei etc. Er is geen causaliteit. Bij het 2e is er wel causaliteit natuurlijk. Het wordt alleen op zijn kop gezet. Beide zaken komen vaak voor het meest in de sociale wetenschappen en de geneeskunde. Bayesiaanse statistiek is een goed geneesmiddel.

  3. Er staat;”Het eerste probleem is dat correlaties ook andersom kunnen gelden, in dit geval: het aantal verdrinkingen stijgt naarmate er meer ijsjes worden verkocht.” Dat is niet andersom ten opzichte van; “als er meer ijsjes worden verkocht (variabele X) dan stijgt het aantal verdrinkingen (variabele Y).” Andersom zou zijn; er worden meer ijsjes verkocht als het aantal verdrinkingen stijgt. Heeft nog niemand dat opgemerkt?

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *