Forskare har visat att ett neuralt nätverk kan tränas med en optisk krets (blå rektangel i illustrationen). I hela nätverket skulle det finnas flera av dessa sammanlänkade. Laseringångarna (grön) kodar information som förs genom chippet av optiska vågledare (svarta). Chipet utför operationer som är avgörande för det artificiella neurala nätverket med hjälp av avstämbara stråldelare, som representeras av de böjda sektionerna i vågledarna. Dessa sektioner kopplar ihop två intilliggande vågledare och ställs in genom att justera inställningarna för optiska fasskiftare (röda och blå glödande objekt), som fungerar som "rattar" som kan justeras under träning för att utföra en given uppgift. Kredit:Tyler W. Hughes, Stanford University
Forskare har visat att det är möjligt att träna artificiella neurala nätverk direkt på ett optiskt chip. Det betydande genombrottet visar att en optisk krets kan utföra en kritisk funktion av ett elektronikbaserat artificiellt neuralt nätverk och kan leda till billigare, snabbare och mer energieffektiva sätt att utföra komplexa uppgifter som tal- eller bildigenkänning.
"Att använda ett optiskt chip för att utföra neurala nätverksberäkningar mer effektivt än vad som är möjligt med digitala datorer skulle kunna göra det möjligt att lösa mer komplexa problem, " sa forskargruppsledare Shanhui Fan vid Stanford University. "Detta skulle förbättra förmågan hos artificiella neurala nätverk att utföra uppgifter som krävs för självkörande bilar eller att formulera ett lämpligt svar på en talad fråga, till exempel. Det kan också förbättra våra liv på sätt som vi inte kan föreställa oss nu."
Ett artificiellt neuralt nätverk är en typ av artificiell intelligens som använder anslutna enheter för att bearbeta information på ett sätt som liknar hur hjärnan bearbetar information. Att använda dessa nätverk för att utföra en komplex uppgift, till exempel röstigenkänning, kräver det kritiska steget att träna algoritmerna för att kategorisera indata, som olika ord.
Även om optiska artificiella neurala nätverk nyligen demonstrerades experimentellt, träningssteget utfördes med en modell på en traditionell digital dator och de slutliga inställningarna importerades sedan till den optiska kretsen. I Optica , The Optical Societys tidskrift för forskning med hög effekt, Forskare vid Stanford University rapporterar en metod för att träna dessa nätverk direkt i enheten genom att implementera en optisk analog av "backpropagation"-algoritmen, vilket är standardsättet att träna konventionella neurala nätverk.
"Att använda en fysisk enhet snarare än en datormodell för träning gör processen mer exakt, sade Tyler W. Hughes, tidningens första författare. "Också, eftersom träningssteget är en mycket beräkningsmässigt dyr del av implementeringen av det neurala nätverket, att utföra detta steg optiskt är nyckeln till att förbättra beräkningseffektiviteten, hastighet och strömförbrukning för konstgjorda nätverk."
Ett ljusbaserat nätverk
Även om neurala nätverksbehandling vanligtvis utförs med en traditionell dator, det finns betydande ansträngningar för att designa hårdvara som är optimerad specifikt för neurala nätverksdatorer. Optikbaserade enheter är av stort intresse eftersom de kan utföra beräkningar parallellt samtidigt som de använder mindre energi än elektroniska enheter.
I det nya verket, forskarna övervann en betydande utmaning för att implementera ett helt optiskt neuralt nätverk genom att designa ett optiskt chip som replikerar det sätt som konventionella datorer tränar neurala nätverk på.
Ett artificiellt neuralt nätverk kan ses som en svart låda med ett antal rattar. Under träningssteget, var och en av dessa rattar vrids lite och sedan testas systemet för att se om algoritmernas prestanda förbättrats.
"Vår metod hjälper inte bara att förutsäga i vilken riktning du ska vrida rattarna utan också hur mycket du ska vrida varje ratt för att komma närmare önskad prestanda, ", sa Hughes. "Vårt tillvägagångssätt snabbar upp träningen avsevärt, speciellt för stora nätverk, eftersom vi får information om varje vred parallellt."
On-chip träning
Det nya träningsprotokollet fungerar på optiska kretsar med inställbara stråldelare som justeras genom att ändra inställningarna för optiska fasskiftare. Laserstrålar som kodar information som ska bearbetas avfyras in i den optiska kretsen och bärs av optiska vågledare genom stråldelaren, som justeras som rattar för att träna de neurala nätverksalgoritmerna.
I det nya träningsprotokollet, lasern matas först genom den optiska kretsen. När du lämnar enheten, skillnaden från det förväntade utfallet beräknas. Denna information används sedan för att generera en ny ljussignal, som skickas tillbaka genom det optiska nätverket i motsatt riktning. Genom att mäta den optiska intensiteten runt varje stråldelare under denna process, forskarna visade hur man upptäcker, parallellt, hur det neurala nätverkets prestanda kommer att förändras med avseende på varje stråldelares inställning. Fasförskjutningsinställningarna kan ändras baserat på denna information, och processen kan upprepas tills det neurala nätverket producerar det önskade resultatet.
Forskarna testade sin träningsteknik med optiska simuleringar genom att lära ut en algoritm för att utföra komplicerade funktioner, som att välja ut komplexa funktioner inom en uppsättning punkter. De fann att den optiska implementeringen fungerade på samma sätt som en konventionell dator.
"Vårt arbete visar att du kan använda fysikens lagar för att implementera datavetenskapliga algoritmer, " sa Fan. "Genom att träna dessa nätverk i den optiska domänen, det visar att optiska neurala nätverkssystem kan byggas för att utföra vissa funktioner med enbart optik."
Forskarna planerar att ytterligare optimera systemet och vill använda det för att implementera en praktisk tillämpning av en neurala nätverksuppgift. Det allmänna tillvägagångssättet de designade skulle kunna användas med olika neurala nätverksarkitekturer och för andra applikationer som omkonfigurerbar optik.