Konstruerat optiskt neuralt nätverk tillämpat på en konventionell maskininlärningsuppgift. Upphovsman:UCLA Engineering Institute for Technology Advancement
Diffraktivt djupt neuralt nätverk är ett ramverk för optisk maskininlärning som använder diffraktiva ytor och konstruerad materia för alla optiskt att utföra beräkningar. Efter dess design och utbildning i en dator med hjälp av moderna metoder för djupinlärning, varje nätverk är fysiskt tillverkat, med exempelvis 3D-utskrift eller litografi, att konstruera den utbildade nätverksmodellen till materia. Denna 3D-struktur av konstruerad materia består av transmissiva och/eller reflekterande ytor som helt och hållet utför maskininlärningsuppgifter genom ljusmaterialinteraktion och optisk diffraktion, med ljusets hastighet, och utan behov av någon kraft, förutom ljuset som lyser inmatningsobjektet. Detta är särskilt viktigt för att känna igen målobjekt mycket snabbare och med betydligt mindre effekt jämfört med vanliga datorbaserade maskininlärningssystem, och kan ge stora fördelar för autonoma fordon och olika försvarsrelaterade applikationer, bland andra. Infördes av UCLA -forskare [1], denna ram validerades experimentellt för objektklassificering och avbildning, tillhandahålla ett skalbart och energieffektivt ramverk för optisk beräkning. I följande forskning, UCLA -ingenjörer förbättrade ytterligare slutresultatet för diffraktiva optiska neurala nätverk genom att integrera dem med vanliga digitala djupa neurala nätverk, bilda hybrid maskininlärningsmodeller som utför beräkning delvis med hjälp av ljusdiffraktion genom materia och delvis med hjälp av en dator [2].
I deras senaste arbete, [3] publicerad i Avancerad fotonik , en open access journal för SPIE, det internationella samhället för optik och fotonik, UCLA -gruppen har utnyttjat fullt ut optikens inneboende parallelliseringsförmåga, och förbättrade signifikant slutresultatet och generaliseringsprestandan för diffraktiva optiska neurala nätverk (se figuren), hjälper till att minska klyftan mellan heloptiska och standard elektroniska neurala nätverk. En av de viktigaste förbättringarna innefattade ett differentialdetekteringsschema, där varje klasspoäng på det optiska nätets utgångsplan beräknas med hjälp av två olika detektorer, en representerar positiva tal och den andra representerar negativa tal. Rätt objektklass (till exempel bilar, flygplan, fartyg etc.) härledas av detektorparet som har den största normaliserade skillnaden mellan de positiva och de negativa detektorerna. Detta differentialdetekteringsschema kombineras också med parallellkörande diffraktiva optiska nätverk, där var och en är specialiserad för att specifikt känna igen en undergrupp av objektklasser. Denna klassspecifika diffraktiva nätverksdesign drar betydande nytta av parallellismen och skalbarheten hos optiska system, bilda parallella ljusvägar inom 3D-konstruerad materia för att separat beräkna klasspoängen för olika typer av objekt.
Dessa nya designstrategier uppnådde oöverträffade nivåer av inferensnoggrannhet för alloptiskt neuralt nätverksbaserat maskininlärning. Till exempel, vid en implementering visade UCLA -forskare numeriskt blindtestningsnoggrannheter på 98,59%, 91,06% och 51,44% för igenkänning av bilder av handskrivna siffror, modeprodukter, och CIFAR-10 gråskalebilddatauppsättning (består av flygplan, bilar, fåglar, katter, rådjur, hundar, grodor, hästar, fartyg, och lastbilar), respektive [3]. För jämförelse, dessa slutresultat kommer nära prestanda för några av de tidigare generationerna av elektroniska djupa neurala nätverk, till exempel, LeNet, som uppnår klassificeringsnoggrannheter på 98,77%, 90,27%, och 55,21% motsvarande samma datamängder, respektive. Nyare design av elektroniska neurala nätverk, som ResNet, uppnå mycket bättre prestanda, fortfarande lämnar en lucka mellan prestanda för heloptiska och elektroniska neurala nätverk. Denna lucka, dock, balanseras av viktiga fördelar med alla optiska neurala nätverk, såsom slutsatsens hastighet, skalbarhet, parallellitet och lågeffektsbehovet för passiva optiska nätverk som använder konstruerat material för att beräkna genom diffraktion av ljus.
Denna forskning leddes av Dr Aydogan Ozcan, som är kanslerprofessor i el- och datateknik vid UCLA, och en associerad direktör för California NanoSystems Institute (CNSI). De andra författarna till detta arbete är doktorander Jingxi Li, Deniz Mengu och Yi Luo, liksom Dr. Yair Rivenson, adjungerad professor i el- och datateknik vid UCLA.
"Våra resultat ger ett stort framsteg för att få optiska neurala nätverksbaserade lösningar med låg effekt och låg latens för olika maskininlärningsprogram, "sade professor Ozcan. Dessutom, dessa systematiska framsteg i diffraktiva optiska nätverksdesigner kan ta oss ett steg närmare utvecklingen av nästa generation, uppgiftsspecifika och intelligenta beräkningskamerasystem.
Denna forskning stöddes av Koç Group, NSF och HHMI.