Kredit:CC0 Public Domain
En maskininlärningsmetod upptäckte en dold ledtråd i människors språk som förutsäger den senare uppkomsten av psykos – den frekventa användningen av ord som är förknippade med ljud. En artikel publicerad av tidskriften npj Schizofreni publicerade resultaten av forskare vid Emory University och Harvard University.
Forskarna utvecklade också en ny maskininlärningsmetod för att mer exakt kvantifiera den semantiska rikedomen i människors samtalsspråk, en känd indikator för psykos.
Deras resultat visar att automatiserad analys av de två språkvariablerna - mer frekvent användning av ord förknippade med ljud och tal med låg semantisk densitet, eller vaghet – kan förutsäga om en person i riskzonen senare kommer att utveckla psykos med 93 procents noggrannhet.
Inte ens utbildade läkare hade lagt märke till hur personer i riskzonen för psykoser använder fler ord förknippade med ljud än genomsnittet, även om onormal hörseluppfattning är ett prekliniskt symptom.
"Att försöka höra dessa subtiliteter i samtal med människor är som att försöka se mikroskopiska bakterier med dina ögon, " säger Neguine Rezaii, tidningens första författare. "Den automatiserade tekniken vi har utvecklat är ett riktigt känsligt verktyg för att upptäcka dessa dolda mönster. Det är som ett mikroskop för varningstecken på psykos."
Rezaii började arbeta med tidningen medan hon bodde på Emory School of Medicines avdelning för psykiatri och beteendevetenskap. Hon är nu på fellow vid Harvard Medical Schools avdelning för neurologi.
"Det var tidigare känt att subtila drag av framtida psykoser finns i människors språk, men vi har använt maskininlärning för att faktiskt avslöja dolda detaljer om dessa funktioner, " säger seniorförfattaren Philip Wolff, professor i psykologi vid Emory. Wolffs labb fokuserar på språksemantik och maskininlärning för att förutsäga beslutsfattande och mental hälsa.
"Vår upptäckt är ny och lägger till bevisen som visar potentialen för att använda maskininlärning för att identifiera språkliga avvikelser associerade med psykisk sjukdom, " säger medförfattaren Elaine Walker, en Emory-professor i psykologi och neurovetenskap som forskar om hur schizofreni och andra psykotiska störningar utvecklas.
Uppkomsten av schizofreni och andra psykotiska störningar inträffar vanligtvis i början av 20-talet, med varningssignaler – känt som prodromalt syndrom – som börjar runt 17 års ålder. Cirka 25 till 30 procent av ungdomar som uppfyller kriterierna för ett prodromalt syndrom kommer att utveckla schizofreni eller annan psykotisk störning.
Med hjälp av strukturerade intervjuer och kognitiva tester, utbildade läkare kan förutsäga psykoser med cirka 80 procents noggrannhet hos personer med prodromalt syndrom. Maskinlärande forskning är bland de många pågående ansträngningarna för att effektivisera diagnostiska metoder, identifiera nya variabler, och förbättra förutsägelsernas noggrannhet.
För närvarande, det finns inget botemedel mot psykos.
"Om vi kan identifiera individer som är i riskzonen tidigare och använda förebyggande insatser, vi kanske kan vända underskotten, ", säger Walker. "Det finns bra data som visar att behandlingar som kognitiv beteendeterapi kan fördröja uppkomsten, och kanske till och med minska förekomsten av psykos."
För den aktuella tidningen, forskarna använde först maskininlärning för att etablera "normer" för samtalsspråk. De matade ett datorprogram med onlinekonversationer av 30, 000 användare av Reddit, en social medieplattform där människor har informella diskussioner om en rad ämnen. Programvaran, känd som Word2Vec, använder en algoritm för att ändra enskilda ord till vektorer, tilldela var och en en plats i ett semantiskt utrymme baserat på dess betydelse. De med liknande betydelser är placerade närmare varandra än de med mycket olika betydelser.
Wolff-labbet utvecklade också ett datorprogram för att utföra det som forskarna kallade "vektoruppackning, " eller analys av den semantiska tätheten av ordanvändning. Tidigare arbete har mätt semantisk koherens mellan meningar. Vektoruppackning gjorde det möjligt för forskarna att kvantifiera hur mycket information som packades in i varje mening.
Efter att ha genererat en baslinje av "normala" data, forskarna använde samma teknik på diagnostiska intervjuer av 40 deltagare som hade utförts av utbildade läkare, som en del av multi-site North American Prodrome Longitudinal Study (NAPLS), finansierat av National Institutes of Health. NAPLS är inriktat på unga människor med klinisk hög risk för psykos. Walker är huvudutredare för NAPLS vid Emory, ett av nio universitet som är involverade i det 14-åriga projektet.
De automatiserade analyserna av deltagarproverna jämfördes sedan med det normala baslinjeprovet och longitudinella data om huruvida deltagarna övergick till psykos.
Resultaten visade att högre än normal användning av ord relaterade till ljud, i kombination med en högre frekvens av att använda ord med liknande betydelse, innebar att psykos sannolikt var vid horisonten.
Studiens styrkor inkluderar enkelheten att använda bara två variabler – som båda har en stark teoretisk grund – replikeringen av resultaten i en datauppsättning som håller ut, och den höga noggrannheten i dess förutsägelser, på över 90 procent.
"På det kliniska området, vi saknar ofta precision, " säger Rezaii. "Vi behöver mer kvantifierade, objektiva sätt att mäta subtila variabler, som de som är gömda inom språkbruk."
Rezaii och Wolff samlar nu in större datamängder och testar tillämpningen av sina metoder på en mängd olika neuropsykiatriska sjukdomar, inklusive demens.
"Denna forskning är intressant inte bara för dess potential att avslöja mer om psykisk ohälsa, men för att förstå hur sinnet fungerar – hur det sätter ihop idéer, ", säger Wolff. "Teknologin för maskininlärning går så snabbt framåt att den ger oss verktyg för att dataminera det mänskliga sinnet."