Man skulle kunna tro vid det här laget att vi otvetydigt kan säga vad som orsakar vad. Men frågan om orsakssamband vs. korrelation , som har hemsökt vetenskap och filosofi från sina tidigaste dagar, trampar fortfarande på oss av många anledningar.
Människor är evolutionärt benägna att se mönster och psykologiskt benägna att samla information som stödjer redan existerande åsikter, en egenskap som kallas bekräftelsebias. Vi blandar ihop sammanträffande med korrelation och korrelation med kausalitet.
Skillnaden mellan orsakssamband och korrelation är att i ett orsakssamband är en händelse direkt ansvarig för en annan, medan i en korrelation existerar två händelser samtidigt, men deras samband kan bero på en tredje variabel.
Det är felaktigt att säga att korrelation innebär orsakssamband. För att A ska orsaka B, tenderar vi att säga att åtminstone:
Enbart sett kan dessa tre krav dock inte bevisa orsak; de är, som filosofer säger, nödvändiga men inte tillräckliga. Alla håller i alla fall inte med dem.
På tal om filosofer, hävdade David Hume att orsakssamband inte existerar i någon bevisbar mening [källa:Cook]. Karl Popper och falsifikationisterna hävdade att vi inte kan bevisa ett samband, bara motbevisa det, vilket förklarar varför statistiska analyser inte försöker bevisa en korrelation; istället drar de en dubbel negativ och motbevisar att data är okorrelerade, en process som kallas att förkasta nollhypotesen [källa:McLeod].
Med sådana överväganden i åtanke måste forskare noggrant utforma och kontrollera sina experiment för att sålla bort fördomar, cirkulära resonemang, självuppfyllande profetior och förvirrande variabler. De måste respektera kraven och begränsningarna för de metoder som används, ta från representativa prover om möjligt och inte överdriva sina resultat.
Istället för att ta på sig den svåra (och kanske omöjliga) uppgiften att fastställa kausalitet, fokuserar den mesta vetenskapliga forskningen på styrkan i samband. Korrelationer kan vara positiva eller negativa, svaga eller starka. Den statistiska korrelationskoefficienten, som sträcker sig från -1 till 1, visar styrkan och riktningen av korrelationen.
Om du plottar datapunkter på en graf där en variabel upptar X-axeln och en annan upptar Y-axeln, korrelerar variablerna om de har ett linjärt samband.
Eftersom den mänskliga hjärnan tenderar att leta efter orsakssamband är forskare extra försiktiga med att skapa mycket kontrollerade experiment - men de gör fortfarande misstag. Här är tio exempel som illustrerar hur svårt det är att identifiera orsakssamband.
Människor är jobbiga att forska. De reagerar inte bara på stimulansen som studeras, utan också på själva experimentet. Forskare i dag försöker designa experiment för att kontrollera sådana faktorer, men det var inte alltid fallet.
Ta Hawthorne Works i Cicero, Illinois. I en serie experiment från 1924 till 1932 studerade forskare arbetarnas produktivitetseffekter förknippade med att förändra miljön i Illinois-fabriken, inklusive ändrade ljusnivåer, städning av platsen och flytta runt arbetsstationer.
Precis när de trodde att de var inne på något märkte de ett problem:de observerade produktivitetsökningarna sjönk nästan så fort forskarna lämnade arbetet, vilket tyder på att arbetarnas kunskap om experimentet – inte forskarnas förändringar – hade drivit på lyft. Forskare kallar fortfarande detta fenomen för Hawthorne-effekten [källa:Obrenović].
Ett relaterat koncept, John Henry-effekten, uppstår när medlemmar i en kontrollgrupp försöker slå den experimentella gruppen genom att överdriva deras ansträngningar. De behöver inte känna till experimentet; de behöver bara se en grupp få nya verktyg eller ytterligare instruktioner. Liksom den ståldrivande legendaren vill de bevisa sina förmågor och tjäna respekt [källor:Saretsky; Vogt].
Titulärkaraktärerna i Tom Stoppards film "Rosencrantz and Guildenstern Are Dead" börjar filmen förbryllad och slutligen rädd när var och en av 157 på varandra följande myntslag kommer upp i huvudet. Guildensterns förklaringar av detta fenomen sträcker sig från tidsslingor till "en spektakulär bekräftelse av principen att varje enskilt mynt, snurrat individuellt, är lika benäget att falla ner i huvudet som svansar ..."
Evolutionen gjorde att människor kunde se mönster, och vår förmåga att korrekt bearbeta den driften verkar kortsluta ju längre tid vi spenderar med att spela. Vi kan rationellt acceptera att oberoende evenemang som slantar håller samma odds oavsett hur många gånger du utför dem.
Men vi ser också dessa händelser, mindre rationellt, som streck, som skapar falska mentala korrelationer mellan randomiserade händelser. När vi ser det förflutna som ett förspel, tänker vi hela tiden att nästa vändning borde vara svansar.
Statistiker kallar detta för spelares felslut, alias Monte Carlo-felet, efter ett särskilt illustrativt exempel som inträffade i den berömda semesterorten i Monaco.
Under sommaren 1913 såg spelarna med ökande förvåning när ett kasinos roulettehjul landade på svart 26 gånger i rad. Inflammerade av vissheten om att rött var "på grund", fortsatte tipparna att plocka ner sina marker. Kasinot gjorde en mynta [källor:Lehrer; Oppenheimer och Monin; Vogt].
Ingen diskussion om streck, magiskt tänkande eller falsk orsakssamband skulle vara komplett utan att bläddra igenom sportsidorna. Stjärnsportsäsonger uppstår från ett så mystiskt samspel av faktorer – naturlig förmåga, träning, självförtroende, en och annan X-faktor – att vi föreställer oss mönster i prestationsförmåga, även om studier upprepade gånger avvisar streak shooting och "framgångsrik" vidskepelse som något mer än imaginära.
Tron på ränder eller svackor antyder att framgång "orsakar" framgång och misslyckande "orsakar" misslyckande eller, kanske mer rimligt, att variation i någon gemensam faktor, såsom självförtroende, orsakar båda. Men studie efter studie lyckas inte bekräfta detta [källa:Gilovich, et al].
Detsamma gäller för vidskepelse, även om det aldrig hindrade den pensionerade NBA-spelaren och Dallas Mavericks-väktaren Jason Terry från att sova i motståndarlagens shorts före varje match, eller NHL-center och den pensionerade Ottawa Senators-spelaren Bruce Gardiner från att doppa sin hockeyklubba i spelet. toalett för att bryta en och annan svacka [källa:Exact Sports].
Den andra nedgången uppstår också vanligtvis från ett för bra första år. Prestandasvängningar tenderar att jämnas ut i det långa loppet, ett fenomen som statistiker kallar regression mot medelvärdet [källa:Barnett, et al]. Inom idrotten är detta medelvärde hjälpt av motståndet, som anpassar sig för att motverka den nya spelarens framgångsrika färdigheter.
Randomiserade kontrollerade prövningar är guldstandarden inom statistik, men ibland – inom epidemiologi, till exempel – tvingar etiska och praktiska överväganden forskare att analysera tillgängliga fall.
Tyvärr riskerar sådana observationsstudier bias, dolda variabler och, värst av allt, studiegrupper som kanske inte exakt återspeglar befolkningen. Att studera ett representativt urval är avgörande; det gör det möjligt för forskare att tillämpa resultat på personer utanför studien, som resten av oss.
Ett exempel:hormonbehandling (HRT) för kvinnor. Utöver att behandla symtom associerade med klimakteriet, hyllades den en gång för att den potentiellt minskade risken för kranskärlssjukdom (CHD), tack vare en mycket välkänt observationsstudie från 1991 [källa:Stampfer och Colditz].
Men senare randomiserade kontrollerade studier, inklusive det storskaliga Women's Health Initiative, avslöjade antingen ett negativt samband eller ett statistiskt obetydligt samband mellan HRT och CHD [källa:Lawlor, et al.].
Varför skillnaden? För det första tenderar kvinnor som använder HRT att komma från högre socioekonomiska skikt och få bättre kvalitet på kost och motion - ett doldt förklarande förhållande som observationsstudien inte helt kunde ta hänsyn till [källa:Lawlor, et al].
1978 hånade sportreportern och krönikören Leonard Koppett förvirringen mellan orsakssamband och samband genom att snett antyda att Super Bowl-resultat kunde förutsäga aktiemarknaden. Det slog tillbaka:Folk trodde inte bara på honom, utan det fungerade - med skrämmande frekvens.
Förslaget, nu allmänt känt som Super Bowl Indicator, gick enligt följande:Om ett av de 16 ursprungliga National Football League-lagen – de som fanns före NFL:s sammanslagning 1966 med American Football League – vann Super Bowl, skulle aktiemarknaden stiga under resten av året. Om ett tidigare AFL-lag vann, skulle det gå ner [källa:Bonsal].
Från 1967 till 1978 gick Koppetts system 12 för 12; fram till 1997, stoltserade det med en framgångsfrekvens på 95 procent. Det snubblade under dot-com-eran (1998–2001) och särskilt 2008, när den stora lågkonjunkturen slog till, trots en vinst av New York Giants (NFC). Ändå, från och med 2022, hade indikatorn en framgångsfrekvens på 73 procent [källa:Chen].
Vissa har hävdat att mönstret existerar, drivet av tro; det fungerar, säger de, för att investerare tror att det gör det, eller för att de tror att andra investerare tror på det.
Denna uppfattning, även om den är smart på ett regressivt sätt, förklarar knappast de 12 år av framgångsrika korrelationer som föregick Koppetts artikel. Andra hävdar att ett mer relevant mönster ligger i aktiemarknadens storskaliga uppåtgående trend, med undantag för några kortsiktiga stora och mindre fluktuationer [källa:Johnson].
Big data - processen att leta efter mönster i datamängder som är så stora att de motstår traditionella analysmetoder - bedömer stor buzz i styrelserummet [källa:Arthur]. Men är större alltid bättre?
Det är en regel som har trummats in i de flesta forskare i deras första statistikklass:När du möter ett hav av data, motstå lusten att åka på fiskeexpedition. Givet tillräckligt med data, tålamod och metodologiskt spelrum är korrelationer nästan oundvikliga, om än oetiska och i stort sett värdelösa.
När allt kommer omkring innebär bara korrelationen mellan två variabler inte orsakssamband; inte heller pekar det i många fall på mycket av ett förhållande.
För det första kan forskare inte använda statistiska mått på korrelation frivilligt; var och en innehåller vissa antaganden och begränsningar som fiskeexpeditioner alltför ofta ignorerar, för att inte tala om de dolda variablerna, provtagningsproblemen och tolkningsbristerna som kan försämra en dåligt utformad studie.
Men big data används i allt högre grad och hyllas för dess ovärderliga bidrag till områden som att skapa skräddarsydda lärandeprogram; bärbara enheter som ger realtidsmatning till dina elektroniska hälsojournaler; och musikstreamingtjänster som ger dig riktade rekommendationer [källa:IntelliPaat]. Förvänta dig bara inte för mycket av big data i kausalitetsavdelningen.
Alla frågor som handlar om pengar kommer att vara djupt splittrande och mycket politiserade, och minimilönehöjningar är inget undantag. Argumenten är varierande och komplexa, men i grunden hävdar den ena sidan att en högre minimilön skadar företagen, vilket driver ner jobbtillgängligheten, vilket skadar de fattiga.
Den andra sidan svarar att det finns få bevis för detta påstående, och att de 76 miljoner amerikaner som arbetar med eller under minimilönen, som vissa hävdar inte är en lön att leva på, skulle dra nytta av en sådan ökning. De hävdar att den federala minimilönen för täckta, icke undantagna anställda (7,25 USD per timme i september 2023) har sänkt amerikanernas köpkraft med mer än 20 procent [källor:U.S. Department of Labor; Cooper, et al].
Som litteraturkritikern George Shaw enligt uppgift sprattlade, "Om alla ekonomer hade slutförts, skulle de aldrig nå en slutsats", och minimilönedebatten verkar bekräfta det [källa:Quote Investigator]. För varje analytiker som säger att minimilöneökningar driver bort jobb, finns det en annan som argumenterar mot en sådan korrelation.
I slutändan delar båda sidor ett grundläggande problem:nämligen det överflöd av anekdotiska bevis som många av deras talande huvuden litar på för att få stöd. Andrahandshistorier och körsbärsplockade data ger svagt te i alla fester, även när de presenteras i vackra stapeldiagram.
Mellan fitnessappar, droger och operationer är viktminskning i USA en bransch på 78 miljarder dollar per år, med miljontals amerikaner som årligen hamnar i viktminskningsfältet [källa:Research and Markets]. Inte överraskande får viktminskningsstudier - bra, dåliga eller fula - mycket press i USA.
Ta den populära idén att äta frukost slår fetma, en sockerfrostad nugget härledd från två huvudstudier:En, en randomiserad kontrollerad studie från Vanderbilt University från 1992, visade att vända på normala frukostvanor, vare sig genom att äta eller inte äta, korrelerade med viktminskning; den andra, en observationsstudie från 2002 av National Weight Control Registry, korrelerade frukostätande med framgångsrika viktförlorare - vilket inte är samma sak som att korrelera det med viktminskning [källor:Brown, et al.; Schlundt, et al.; Wyatt, et al.].
Tyvärr misslyckades NWCR-studien med att kontrollera för andra faktorer - eller, faktiskt, fastställa något orsakssamband från dess korrelation. Till exempel kan en person som vill gå ner i vikt träna mer, äta frukost eller äta helsvinsprotein, men utan en experimentell design som kan slå in orsakssamband, uppgår sådana beteenden inte till något mer än vanliga egenskaper som förekommer samtidigt [källa] :Brown, et al].
Ett liknande problem plågar de många studierna som kopplar samman familjemiddagar med en minskad risk för drogberoende för tonåringar. Även om de är attraktiva för sin enkla, tilltalande strategi, misslyckas dessa studier ofta med att kontrollera för relaterade faktorer, såsom starka familjeband eller djupt engagemang från föräldrar i ett barns liv [källa:Miller, et al].
Vi hör ofta att män, särskilt unga män, är mer benägna att begå självmord än kvinnor. I själva verket ingår sådana uttalanden av empirisk generalisering – handlingen att göra ett brett uttalande om ett gemensamt mönster utan att försöka förklara det – och maskerar flera kända och potentiella förvirrande faktorer.
Ta till exempel en Youth Risk Behaviors Survey från 2021 fann att flickor i årskurs 9-12 försökte begå självmord nästan dubbelt så ofta som manliga elever (13 procent mot 7 procent) [källa:American Foundation for Suicide Prevention].
Hur kan det då finnas en högre korrelation mellan det motsatta könet och självmord? Svaret ligger i självmordsförsök med metodik:Medan den vanligaste metoden för självmord för båda könen 2020 var med skjutvapen (57,9 procent för män och 33,0 procent för kvinnor), var kvinnor nästan lika benägna att dö av förgiftning eller kvävning [källa:National Institute of Mental Health].
Även om vi skulle kunna göra oss av med sådana förvirrande faktorer, skulle faktum kvarstå att manlighet i sig inte är en orsak. För att förklara trenden måste vi istället identifiera faktorer som är gemensamma för män, eller åtminstone självmordsbenägna sådana.
Samma sak gäller den jämförelsevis höga självmordsfrekvensen som rapporterats bland frånskilda män. Skilsmässa får inte män att begå självmord; om något är det mer indikativt på ett underliggande orsakssamband med faktorer som manlig roll inflexibilitet, deras sociala nätverk, den ökande betydelsen av barnomsorg och mäns önskan om kontroll i relationer [källa:Scourfield och Evans].
Ingen korrelations-/orsakslista skulle vara komplett utan att diskutera föräldrars oro över vaccinationssäkerhet. Innan covid-19-pandemin drabbade världen 2020 var huvudfrågan en rädsla bland vissa föräldrar för att vaccination mot mässling, påssjuka och röda hund var orsakssamband med autismspektrumstörningar. Denna föreställning populariserades av kändisar som Jenny McCarthy.
Trots att det medicinska samfundet avslöjade Andrew Wakefield-dokumentet från 1998 som inspirerade falskheten, och trots att efterföljande studier inte visar något orsakssamband, förblir vissa föräldrar rädda för en autismkoppling eller andra vaccinrelaterade faror [källor:Park; Sifferlin; Szabo].
Sedan kom covid-19 och har hittills dödat miljoner runt om i världen. Forskare tävlade för att skapa ett effektivt vaccin och de lyckades; det första amerikanska COVID-19-vaccinet var tillgängligt i december 2020 under FDA:s tillstånd för akut användning [källa:FDA]. Men det blev också snabbt sammanflätat med den extrema polariseringen av amerikansk politik och desinformation.
Många föräldrar, särskilt republikaner, fruktade att vaccinerna var osäkra eftersom de utvecklades så snabbt och för att det kan finnas ännu okända långtidsbiverkningar. Det fanns också felaktiga farhågor om att vaccinet skulle påverka framtida fertilitet. De har nu bevisats vara falska [källa:Kelen och Maragakis].
Från och med januari 2022 hade bara 28 procent av 5- till 11-åringarna fått minst en dos av vaccinet, vilket gjorde många inom det medicinska området besviken [källor:Hamel, Kates]. Antalet vaccinerade barn växer; i maj 2023 hade 40 procent av 5- till 11-åringarna fått en minst färdig dos [källa:CDC].
Det är inga ofarliga missförstånd. Trots att man avslöjar en koppling mellan autism och barndomsvacciner, är många föräldrar fortfarande skeptiska till skotten. Under 2019 fanns det 1 282 fall av mässling i 31 stater, det högsta antalet i USA sedan 1992. Majoriteten av dessa fall var bland de ovaccinerade [källa:CDC].
Huruvida den korrespondensen är slumpmässig, korrelativ eller kausal är väl värt att överväga. Och effekterna av den nuvarande tvekan om covid-19-vaccination återstår att se.