• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Analysera talat språk och 3D-ansiktsuttryck för att mäta svårighetsgraden av depression

    Multimodal data. För varje klinisk intervju, forskarna använder:(a) video av 3D-ansiktsskanningar, (b) ljudinspelning, visualiseras som ett log-mel spektrogram, och (c) texttranskription av patientens tal. Modellen förutsäger svårighetsgraden av depressiva symtom genom att använda alla tre modaliteterna. Kredit:Haque et al.

    Forskare vid Stanford har nyligen undersökt användningen av maskininlärning för att mäta svårighetsgraden av depressiva symtom genom att analysera människors talade språk och 3D-ansiktsuttryck. Deras multimodellmetod, beskrivs i ett papper som för publicerats på arXiv, uppnått mycket lovande resultat, med en 83,3 procent sensitivitet och 82,6 procent specificitet.

    För närvarande, över 300 miljoner människor världen över lider av depression i olika grad. I extrema fall, depression kan leda till självmord, med ett genomsnitt på cirka 800, 000 personer begår självmord varje år.

    Psykiska störningar diagnostiseras för närvarande efter noggrann undersökning av ett brett spektrum av vårdgivare, inklusive primärvårdsläkare, kliniska psykologer och psykiatriker. Ändå, Att upptäcka psykiska sjukdomar är ofta mycket mer utmanande än att diagnostisera fysiska sjukdomar.

    Flera faktorer, inklusive socialt stigma, behandlingskostnad och tillgänglighet, kan hindra drabbade personer från att söka hjälp. För närvarande, forskare uppskattar att 60 procent av de som drabbas av psykisk ohälsa inte får behandling.

    Att utveckla metoder som automatiskt kan upptäcka depressiva symtom skulle kunna förbättra noggrannheten och tillgängligheten av diagnostiska verktyg, vilket leder till snabbare och effektivare insatser. Ett team av forskare vid Stanford har nyligen undersökt användningen av maskininlärning för att mäta svårighetsgraden av depressiva symptom.

    "I det här arbetet, vi presenterar en maskininlärningsmetod för att mäta svårighetsgraden av depressiva symptom, " skrev forskarna i sin uppsats. "Vår multimodala metod använder 3D-ansiktsuttryck och talat språk, allmänt tillgänglig från moderna mobiltelefoner."

    Att lära sig en multimodal meningsinbäddning. Övergripande, modellen är en kausal CNN. Ingången för modellen är:ljud, 3D ansiktsskanningar, och text. Den multimodala meningsinbäddningen matas till en depressionsklassificerare och PHQ-regressionsmodell (visas inte ovan). Kredit:Haque et al.

    Deprimerade individer uppvisar ofta en rad verbala och icke-verbala symtom, inklusive monoton tonhöjd, minskad artikulation, lägre talvolymer, färre gester, och mer nedåtgående blickar. Ett av de vanligaste testerna för att bedöma svårighetsgraden av depressionssymtom är patienthälsans frågeformulär (PHQ).

    Metoden som forskarna tagit fram analyserar ljudspår av patienters röst, 3D-video av deras ansiktsuttryck, och texttranskriptioner av deras kliniska intervjuer. Baserat på dessa uppgifter, modellen producerar antingen en PHQ-poäng eller klassificeringsetikett som indikerar allvarlig depressiv sjukdom.

    I en första utvärdering, modellen uppnådde ett genomsnittligt fel på 3,67 poäng (15,3 procent relativt), på PHQ-skalan, detektering av egentlig depression med 83,3 procents sensitivitet och 82,6 procent specificitet. Forskarna valde att samla in data som användes i sin studie via människa-till-dator-intervjuer, snarare än från människa till människa.

    "Jämfört med en mänsklig intervjuare, forskning har visat att patienter rapporterar lägre rädsla för avslöjande och visar mer emotionell intensitet när de samtalar med en avatar, " skrev forskarna. "Dessutom, människor upplever psykologiska fördelar av att avslöja känslomässiga upplevelser för chatbots."

    I framtiden, denna nya maskininlärningsmetod skulle kunna användas i smartphones över hela världen, hjälpa till med uppdraget att göra mentalvården billigare och mer tillgänglig. Enligt forskarna, deras modell är utformad för att utöka och komplettera befintliga kliniska metoder, snarare än att ställa formella diagnoser.

    "Vi presenterade en multimodal maskininlärningsmetod som kombinerar tekniker från taligenkänning, datorsyn, och naturlig språkbehandling, " skrev forskarna. "Vi hoppas att detta arbete kommer att inspirera andra att bygga AI-baserade verktyg för att förstå psykiska störningar bortom depression."

    © 2018 Science X Network




    © Vetenskap https://sv.scienceaq.com