Testuppsättningsbedömning. Jämförelse av den ursprungliga tolkande radiologbedömningen med djupinlärningsmodellen (DL) för (a) binär och (c) fyrvägs mammografisk bröstdensitetsklassificering. (b, d) Motsvarande exempel på mammografi med överensstämmande och diskordanta bedömningar av radiolog och med DL-modellen. Kredit:Radiological Society of North America
Forskare från MIT och Massachusetts General Hospital har utvecklat en automatiserad modell som bedömer tät bröstvävnad i mammografi - vilket är en oberoende riskfaktor för bröstcancer - lika tillförlitligt som expertradiologer.
Detta är första gången en djupinlärningsmodell av sitt slag framgångsrikt har använts på en klinik på riktiga patienter, enligt forskarna. Med bred implementering, forskarna hoppas att modellen kan bidra till ökad tillförlitlighet för brösttäthetsbedömningar över hela landet.
Det uppskattas att mer än 40 procent av amerikanska kvinnor har tät bröstvävnad, vilket i sig ökar risken för bröstcancer. Dessutom, tät vävnad kan maskera cancer på mammografin, gör screening svårare. Som ett resultat, 30 amerikanska stater har mandat att kvinnor måste meddelas om deras mammografi visar att de har täta bröst.
Men bedömningar av brösttäthet bygger på subjektiv mänsklig bedömning. På grund av många faktorer, resultaten varierar – ibland dramatiskt – mellan radiologer. MIT- och MGH-forskarna tränade en djupinlärningsmodell på tiotusentals digitala mammografier av hög kvalitet för att lära sig att särskilja olika typer av bröstvävnad, från fet till extremt tät, baserat på expertbedömningar. Givet ett nytt mammografi, modellen kan sedan identifiera en densitetsmätning som ligger nära expertutlåtanden.
"Brösttäthet är en oberoende riskfaktor som driver hur vi kommunicerar med kvinnor om deras cancerrisk. Vår motivation var att skapa ett korrekt och konsekvent verktyg, som kan delas och användas i sjukvårdssystemen, " säger andra författaren Adam Yala, en Ph.D. student vid MIT:s datavetenskap och artificiell intelligens Laboratory (CSAIL).
De andra medförfattarna är första författaren Constance Lehman, professor i radiologi vid Harvard Medical School och chef för bröstavbildning vid MGH; och seniorförfattaren Regina Barzilay, Delta Electronics Professor vid CSAIL och Institutionen för elektroteknik och datavetenskap vid MIT.
Kartläggningstäthet
Modellen är byggd på ett konvolutionellt neuralt nätverk (CNN), som också används för datorseende uppgifter. Forskarna tränade och testade sin modell på en datauppsättning av mer än 58, 000 slumpmässigt utvalda mammografi från fler än 39, 000 kvinnor screenade mellan 2009 och 2011. För utbildning, de använde cirka 41, 000 mammografi och, för provning, ca 8, 600 mammografi.
Varje mammografi i datamängden har en standardbröstavbildningsrapportering och -datasystem (BI-RADS) bröstdensitetsvärdering i fyra kategorier:fet, spridd (spridd densitet), heterogen (mestadels tät), och tät. Vid både träning och testning av mammografi, cirka 40 procent bedömdes som heterogena och täta.
Under utbildningsprocessen, modellen ges slumpmässiga mammografi för att analysera. Den lär sig att kartlägga mammografin med expertradiologernas täthetsvärderingar. Täta bröst, till exempel, innehåller körtel- och fibrös bindväv, som framstår som kompakta nätverk av tjocka vita linjer och solida vita fläckar. Fettvävnadsnätverk verkar mycket tunnare, med gråzon genomgående. Vid testning, modellen observerar nya mammografi och förutsäger den mest sannolika densitetskategorin.
Matchande bedömningar
Modellen implementerades vid bröstavbildningsavdelningen vid MGH. I ett traditionellt arbetsflöde, när ett mammografi tas, det skickas till en arbetsstation för en radiolog att bedöma. Forskarnas modell är installerad i en separat maskin som fångar upp skanningarna innan den når radiologen, och tilldelar varje mammografi en densitetsklassificering. När radiologer gör en skanning på sina arbetsstationer, de kommer att se modellens tilldelade betyg, som de sedan accepterar eller förkastar.
"Det tar mindre än en sekund per bild ... [och det kan] enkelt och billigt skalas över hela sjukhus." säger Yala.
På över 10, 000 mammografi vid MGH från januari till maj i år, modellen uppnådde 94 procents överensstämmelse bland sjukhusets radiologer i ett binärt test – som avgjorde om brösten var antingen heterogena och täta, eller fet och spridd. I alla fyra BI-RADS-kategorierna, det matchade radiologernas bedömningar till 90 procent. "MGH är ett förstklassigt bröstavbildningscenter med hög interradiologöverenskommelse, och denna högkvalitativa datauppsättning gjorde det möjligt för oss att utveckla en stark modell, " säger Yala.
Vid allmän testning med den ursprungliga datamängden, modellen matchade de ursprungliga mänskliga experttolkningarna till 77 procent över fyra BI-RADS-kategorier och, i binära tester, matchade tolkningarna på 87 procent.
I jämförelse med traditionella prediktionsmodeller, forskarna använde ett mått som kallas kappa-poäng, där 1 anger att förutsägelser överensstämmer varje gång, och allt lägre indikerar färre fall av avtal. Kappa-poäng för kommersiellt tillgängliga automatiska densitetsbedömningsmodeller ger maximalt cirka 0,6. I den kliniska tillämpningen, forskarnas modell fick 0,85 kappa poäng och, vid testning, fick 0,67. Detta innebär att modellen gör bättre förutsägelser än traditionella modeller.
I ett ytterligare experiment, forskarna testade modellens överensstämmelse med konsensus från fem MGH-radiologer från 500 slumpmässiga testmammografier. Radiologerna tilldelade mammografin brösttäthet utan kunskap om den ursprungliga bedömningen, eller deras kamraters eller modellens bedömningar. I detta experiment, modellen uppnådde ett kappa-poäng på 0,78 med radiologens konsensus.
Nästa, forskarna siktar på att skala modellen till andra sjukhus. "Byggande på denna översättningsupplevelse, vi kommer att utforska hur man kan omvandla maskininlärningsalgoritmer som utvecklats vid MIT till en klinik som gynnar miljontals patienter, " Barzilay säger. "Detta är en stadga av det nya centret vid MIT - Abdul Latif Jameel Clinic for Machine Learning in Health vid MIT - som nyligen lanserades. Och vi är glada över nya möjligheter som detta center öppnar."