En ny metod för maskininlärning kan hjälpa forskare att lösa problem som att ta reda på de bästa storlekarna på cylindrar för att fånga elektromagnetisk energi. Kredit:Duke University School of Nursing
Elektroingenjörer vid Duke University har tagit fram en ny metod för att lösa svåra designproblem med många potentiella lösningar i ett stort designutrymme med hjälp av maskininlärning. Kallas "neural-adjoint-metoden, "tillvägagångssättet avslöjar framgångsrikt en optimerad design för en elektromagnetisk kommunikationsenhet och kan också användas för många andra designutmaningar, allt från biomedicinsk avbildning till holografi.
Forskningen publicerades online den 24 februari i tidskriften Optik Express , med titeln "Neural-adjoint-metod för invers design av helt dielektriska metasytor."
Problemet som den nya maskininlärningsmetoden löser är att lösa omvända problem, vilket innebär att forskare vet vilket resultat de vill ha men är inte säkra på det bästa sättet att uppnå det. Inom denna typ av utmaning finns en klass som kallas dåligt inverterade problem, vilket innebär att det finns ett oändligt antal lösningar utan vägledning om vilken som kan vara den bästa.
"Om man får två siffror att lägga till, du kan få en direkt och enkel lösning, "förklarade Willie Padilla, professor i el- och datateknik vid Duke. "Men om jag säger att ge mig två reella tal som summerar till tre, det finns en oändlig uppsättning siffror som kan vara svaret med noll förståelse om det korrekta svaret har valts. Att vända på den här enkla uppgiften visar hur utmanande ett illa ställt omvänt problem kan vara."
I den nya forskningen, den specifika uppgiften Padilla försöker lösa är att hitta den bästa designen för ett dielektriskt (metallfritt) metamaterial som producerar ett specifikt elektromagnetiskt svar. Metamaterial är syntetiska material som består av många individuella konstruerade egenskaper, som tillsammans producerar egenskaper som inte finns i naturen. De uppnår detta genom sin struktur snarare än sin kemi. I Padillas dielektriska metamaterialförsök, han använder ett stort ark byggt av individuella två och två galler av kiselcylindrar som liknar korta, fyrkantiga legos.
Att beräkna hur de elektromagnetiska effekterna av en identisk uppsättning cylindrar interagerar med varandra är en enkel process som kan utföras med kommersiell programvara. Men att lösa det illa ställda omvända problemet med vilken geometri som bäst ger en önskad uppsättning egenskaper är ett mycket svårare förslag. Eftersom varje cylinder skapar ett elektromagnetiskt fält som sträcker sig utanför dess fysiska gränser, de interagerar med varandra i en oförutsägbar, olinjärt sätt.
"Om du försöker bygga ett önskat svar genom att kombinera de elektromagnetiska effekterna som produceras av varje enskild cylinder, du kommer att få en komplicerad karta över många höga och låga toppar som inte bara är en summa av deras delar, " sa professor Padilla. "Det är ett enormt geometriskt parameterutrymme och du är helt blind - det finns ingen indikation på vilken väg du ska gå."
Padillas nya maskininlärningsmetod för att navigera i detta komplexa designutrymme börjar med att träna ett djupt neuralt nätverk med 60, 000 simuleringar av olika konstruktioner och de elektromagnetiska egenskaper de producerar. Även om man tar hänsyn till 14 geometriska parametrar, maskininlärningsalgoritmen lärde sig funktionen som förbinder den komplexa geometrin med det elektromagnetiska resultatet.
Vid denna tidpunkt, det djupa neurala nätverket skulle kunna ge forskare ett svar på en omvänd fråga om att hitta en geometri som kan ge ett önskat svar. Men med 1,04 biljoner potentiella lösningar, det skulle ta det neurala nätverket över tre år att hitta ett svar.
"Såvitt jag vet, detta är det största fotonikproblemet med geometriska rymd som någon har arbetat med, " sa Padilla. "Om du försökte lösa det med en vanlig datoralgoritm, det skulle ta 600 miljoner år. Det djupa neurala nätverket samplade bara 0,00000575% av designutrymmet, men den lärde sig funktionen ändå."
Samtidigt som en imponerande bedrift, det är det andra steget i denna process som verkligen är nytt. Även om forskarna inte vet exakt hur den funktion som det djupa neurala nätverket kom med faktiskt ser ut, de kan använda den för att arbeta mot ett optimalt svar.
Den nya neural-adjoint-metoden fungerar genom att börja vid 16, 000 slumpmässiga poäng och beräkna hur bra en lösning var och en är. Det låter sedan var och en gå mot en bättre lösning - en process som kallas gradientnedstigning. Genom att upprepa denna process flera gånger, Algoritmen arbetar sig fram till lokalt optimerade lösningar. Avgörande, forskarna sätter också lägsta och maximala gränser baserat på deras kunskap om det utrymme som maskininlärningen är korrekt inom, som hindrade algoritmen från att bli för galen med sina lösningar.
Efter 300 iterationer, programmet tittar på de 16, 000 lokalt optimala lösningar den hittade och väljer det bästa alternativet. Det indikerar också om det kan finnas en gräns för en parameter som kan möjliggöra en bättre lösning om den utökades.
"När man gör denna forskning, vi såg alla våra bästa lösningar fastnade mot den maximala höjden vi hade ställt in för cylindrarna, " sa Padilla. "Vi begränsade oss men visste inte om det. Så vi utökade höjden, gjorde ännu fler simuleringar, och verkligen hittat en bättre lösning."
Tillämpas på metamaterial, Padilla säger att den här metoden kan hjälpa till att utveckla platta kommunikationsantenner för sidorna av byggnader som snabbt kan konfigurera om sig själva för att bättre nå närliggande användare. Men han säger att det också kan användas i ett brett spektrum av applikationer som samlar in information från elektromagnetiska vågor. Till exempel, tolka röntgenstrålar eller magnetiska vågor i medicinska bildapparater eller utveckla datorgenererade hologram.