Upphovsman:Massachusetts Institute of Technology
"Deep Learning" datasystem, baserat på artificiella neurala nätverk som efterliknar hur hjärnan lär sig av en ansamling av exempel, har blivit ett hett ämne inom datavetenskap. Förutom att möjliggöra teknik som programvara för ansikts- och röstigenkänning, dessa system kan skura stora mängder medicinsk data för att hitta mönster som kan vara användbara diagnostiskt, eller skanna kemiska formler för eventuella nya läkemedel.
Men beräkningarna som dessa system måste utföra är mycket komplexa och krävande, även för de mest kraftfulla datorerna.
Nu, ett team av forskare vid MIT och på andra håll har utvecklat en ny metod för sådana beräkningar, använder ljus istället för elektricitet, som de säger kan avsevärt förbättra hastigheten och effektiviteten hos vissa djupinlärningsberäkningar. Deras resultat visas idag i tidningen Nature Photonics i ett papper av MIT postdoc Yichen Shen, doktorand Nicholas Harris, professorerna Marin Soljacic och Dirk Englund, och åtta andra.
Soljacic säger att många forskare genom åren har gjort påståenden om optikbaserade datorer, men att "människor dramatiskt överlovade, och det slog till. "Även om många föreslagna användningar av sådana fotoniska datorer visade sig inte vara praktiska, ett ljusbaserat neuralt nätverkssystem utvecklat av detta team "kan vara tillämpligt för djupinlärning för vissa applikationer, " han säger.
Traditionella datorarkitekturer är inte särskilt effektiva när det gäller de beräkningar som behövs för vissa viktiga neurala nätverksuppgifter. Sådana uppgifter involverar vanligtvis upprepade multiplikationer av matriser, vilket kan vara mycket beräknande intensivt i konventionella CPU- eller GPU -chips.
Efter år av forskning, MIT -teamet har kommit på ett sätt att utföra dessa operationer optiskt istället. "Detta chip, när du har ställt in den, kan utföra matrismultiplikation med, i princip, noll energi, nästan omedelbart, "Säger Soljacic." Vi har visat de avgörande byggstenarna men ännu inte hela systemet. "
I analogi, Soljacic påpekar att även en vanlig glasögonlins utför en komplex beräkning (den så kallade Fouriertransformationen) på ljusvågorna som passerar genom den. Hur ljusstrålar utför beräkningar i de nya fotoniska chipsen är mycket mer allmänt men har en liknande underliggande princip. Den nya metoden använder flera ljusstrålar riktade på ett sådant sätt att deras vågor interagerar med varandra, producerar störningsmönster som förmedlar resultatet av den avsedda operationen. Den resulterande enheten är något forskarna kallar en programmerbar nanofoton processor.
Resultatet, Shen säger, är att de optiska chipsen som använder denna arkitektur kan, i princip, utföra beräkningar som utförs i typiska artificiella intelligensalgoritmer mycket snabbare och använder mindre än en tusendel så mycket energi per operation som konventionella elektroniska chips. "Den naturliga fördelen med att använda ljus för matrismultiplikation spelar en stor roll i hastigheten och energibesparingarna, eftersom täta matrismultiplikationer är den mest energihungriga och tidskrävande delen i AI -algoritmer, säger han.
Den nya programmerbara nanofotonprocessorn, som utvecklades i Englund -labbet av Harris och medarbetare, använder en rad vågledare som är sammankopplade på ett sätt som kan modifieras efter behov, programmera den uppsättningen strålar för en specifik beräkning. "Du kan programmera i valfri matrisoperation, "Säger Harris. Processorn leder ljus genom en serie kopplade fotoniska vågledare. Teamets fullständiga förslag kräver interfolierade lager av enheter som tillämpar en operation som kallas en olinjär aktiveringsfunktion, i analogi med neurons funktion i hjärnan.
För att demonstrera konceptet, laget ställde in den programmerbara nanofotonprocessorn för att implementera ett neuralt nätverk som känner igen fyra grundläggande vokalljud. Även med detta rudimentära system, de kunde uppnå en noggrannhetsnivå på 77 procent, jämfört med cirka 90 procent för konventionella system. Det finns "inga väsentliga hinder" för att skala upp systemet för större noggrannhet, Säger Soljacic.
Englund tillägger att den programmerbara nanofotonprocessorn också kan ha andra applikationer, inklusive signalbehandling för dataöverföring. "Höghastighets analog signalbehandling är något detta kan hantera" snabbare än andra tillvägagångssätt som först konverterar signalen till digital form, eftersom ljuset är ett naturligt analogt medium. "Detta tillvägagångssätt kan göra bearbetning direkt i den analoga domänen, " han säger.
Teamet säger att det fortfarande kommer att ta mycket mer ansträngning och tid att göra detta system användbart; dock, när systemet är skalat upp och fungerar fullt ut, det kan hitta många användarfall, som datacenter eller säkerhetssystem. Systemet kan också vara en välsignelse för självkörande bilar eller drönare, säger Harris, eller "när som helst du behöver göra mycket beräkning men du har inte mycket kraft eller tid."
Denna artikel publiceras på nytt med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT -forskning, innovation och undervisning.