Kredit:CC0 Public Domain
Orsakerna till verkliga problem inom ekonomi och folkhälsa kan vara notoriskt svåra att fastställa. Ofta, flera orsaker misstänks, men stora datamängder med tidssekvenserade data är inte tillgängliga. Tidigare modeller kunde inte på ett tillförlitligt sätt analysera dessa utmaningar. Nu, Forskare har testat den första artificiella intelligensmodellen för att identifiera och rangordna många orsaker i verkliga problem utan tidssekvenserad data, med användning av en multinodal kausal struktur och riktade acykliska grafer.
När något dåligt händer, det är naturligt att försöka ta reda på varför det hände. Vad orsakade det? Om orsaken fastställs, det kan vara möjligt att undvika samma resultat nästa gång. Dock, några av de sätt på vilka människor försöker förstå händelser, som att tillgripa vidskepelse, kan inte förklara vad som faktiskt händer. Inte heller korrelation, vilket bara kan säga att händelse B inträffade ungefär samtidigt som händelse A.
För att verkligen veta vad som orsakade en händelse, vi måste titta på kausalitet – hur information flödar från en händelse till en annan. Det är informationsflödet som visar att det finns ett orsakssamband – att händelse A orsakade händelse B. Men vad händer när det tidssekvenserade informationsflödet från händelse A till händelse B saknas? Generell kausalitet krävs för att identifiera orsakerna.
Matematiska modeller för allmän kausalitet har varit mycket begränsade, arbetar för upp till två orsaker. Nu, i ett genombrott för artificiell intelligens, Forskare har utvecklat den första robusta modellen för allmän kausalitet som identifierar flera orsakssamband utan tidssekvensdata, Multivariate Additive Noise Model (MANM).
Forskare från University of Johannesburg, Sydafrika, och National Institute of Technology Rourkela, Indien, utvecklade modellen och testade den på simulerade, datauppsättningar i den verkliga världen. Forskningen publiceras i tidskriften Neurala nätverk .
"Unikt, modellen kan identifiera flera, hierarkiska orsaksfaktorer. Det fungerar även om data med tidssekvensering inte är tillgänglig. Modellen skapar betydande möjligheter att analysera komplexa fenomen inom områden som ekonomi, sjukdomsutbrott, klimatförändring och bevarande, " säger prof Tshilidzi Marwala, en professor i artificiell intelligens, och global AI- och ekonomiexpert vid University of Johannesburg, Sydafrika.
"Modellen är särskilt användbar på regionala, nationell eller global nivå där inga kontrollerade eller naturliga experiment är möjliga, ", tillägger Marwala.
Vidskepelse och samband mot kausalitet
"Om en svart katt springer över vägen, eller en uggla tutar på ett tak, vissa människor är övertygade om att något riktigt dåligt kommer att hända. En person kan tro att det finns ett samband mellan att se katten eller ugglan och vad som hände efteråt. Dock, ur artificiell intelligenssynpunkt, vi säger att det inte finns några orsakssamband mellan katten, ugglan, och vad som händer med människorna som ser dem. Katten eller ugglan sågs strax före händelsen, men de är bara korrelerade i tid med vad som hände senare, " säger prof Marwala.
Under tiden, inne i huset där ugglan sågs, något mer läskigt kan hända. Familjen inuti kan glida djupare och djupare in i skulder. En sådan ekonomisk situation kan medföra allvarliga restriktioner för hushållet, så småningom att bli en fälla som det finns lite flykt från. Men förstår människorna som bor där de faktiska orsakssambanden mellan vad som händer med dem, vad dem gör, och deras skuldnivåer?
Kausalitet på hushållsnivå
Orsakerna till ihållande hushållens skuldsättning är ett bra exempel på vad den nya modellen kan, säger postdoktorn Dr Pramod Kumar Parida, huvudförfattare till forskningsartikeln.
"På hushållsnivå kan man fråga sig:Har hushållet förlorat en del eller hela sin inkomst? Är det några eller alla medlemmar som spenderar utöver sin inkomst? Har något hänt hushållsmedlemmarna som tvingar fram stora utgifter, såsom sjukvårds- eller handikappräkningar? Förbrukar de sina besparingar eller investeringar, som har tagit slut nu? Händer en kombination av dessa saker, om så är fallet, vilka är de mest dominerande orsakerna till skulden?"
Om det finns tillräckligt med data om hushållets finansiella transaktioner, komplett med information om datum och tid, det är möjligt för någon att ta reda på de faktiska orsakssambanden mellan inkomst, spendera, besparingar, investeringar och skulder.
I detta fall, enkel kausalitetsteori är tillräcklig för att ta reda på varför detta hushåll kämpar.
Allmän kausalitet på samhällsnivå
Men, säger Parida, "Vilka är de verkliga anledningarna till att de flesta människor i en stad eller region har det svårt ekonomiskt? Varför blir de inte skuldfri?" Nu, det är inte längre möjligt för ett team av människor att ta reda på detta utifrån tillgänglig data, och en helt ny matematisk utmaning öppnar sig.
"Särskilt om man vill ha de faktiska orsakssambanden mellan hushållsinkomst, spendera, besparingar och skulder för staden eller regionen, snarare än expertgissningar eller vad de flesta tror, "" han lägger till.
"Här, kausalitetsteorin misslyckas, eftersom de finansiella transaktionsuppgifterna för hushållen i staden eller regionen kommer att vara ofullständiga. Också, information om datum och tid kommer att saknas för vissa data. Ekonomisk kamp i låg, medel- och höginkomsthushåll kan vara väldigt olika, så du vill se de olika orsakerna från analysen, säger Parida.
"Med den här modellen, du kan identifiera kan identifiera flera viktiga drivande faktorer som orsakar hushållets skulder. I modellen, vi kallar dessa faktorer för de oberoende överordnade orsakssambanden. Du kan också se vilka orsakssamband som är mer dominerande än de andra. Med en andra passage genom data, du kan också se de mindre drivande faktorerna, det vi kallar de oberoende barnets orsakssamband. På det här sättet, det är möjligt att identifiera en möjlig hierarki av orsakssamband."
Betydligt förbättrad orsaksanalys
Multivariate Additive Noise Model (MANM) ger betydligt bättre orsaksanalys på datauppsättningar i verkliga världen än industristandardmodeller som för närvarande används, säger medförfattaren Prof Snehashish Chakraverty, på den tillämpade matematikgruppen, Institutionen för matematik, National Institute of Technology Rourkela, Indien.
"För att förbättra ett komplext regionalt problem som hushållens skulder eller sjukvårdsutmaningar, det kanske inte är tillräckligt att ha kunskap om skuldmönster, eller av sjukdom och exponering. Tvärtom, vi borde förstå varför sådana mönster finns, att ha det bästa sättet att ändra dem. Tidigare modeller utvecklade av forskare arbetade med maximalt två orsaksfaktorer, det vill säga att de var bivariata modeller, som helt enkelt inte kunde hitta flera kriterier för funktionsberoende, " han säger.
Regisserad acykliska grafer
"MANM är baserat på Directed Acyclic Graphs (DAGs), som kan identifiera en multinodal kausal struktur. MANM kan uppskatta alla möjliga orsaksriktningar i komplexa funktionsuppsättningar, utan saknade eller fel vägbeskrivningar."
Användningen av DAG är en viktig orsak till att MANM avsevärt överträffar modeller som tidigare utvecklats av andra, som baserades på oberoende komponentanalys (ICA), såsom linjär icke-gaussisk acyklisk modell (ICA-LiNGAM), Greedy DAG Search (GDS) och regression med efterföljande oberoende test (RESIT), han säger.
"En annan nyckelfunktion hos MANM är den föreslagna orsaksfaktorn (CIF), för framgångsrik upptäckt av kausala riktningar i det multivariata systemet. CIF-poängen ger en tillförlitlig indikator på kvaliteten på den tillfälliga slutsatsen, som gör det möjligt att undvika de flesta av de saknade eller felaktiga riktningarna i den resulterande kausala strukturen, avslutar Chakraverty.
Om en befintlig datauppsättning är tillgänglig, MANM gör det nu möjligt att identifiera flera multi-nodala kausala strukturer inom uppsättningen. Som ett exempel, MANM kan identifiera de många orsakerna till ihållande hushållens skuldsättning för låg, medel- och höginkomsthushåll i en region.