Kredit:CC0 Public Domain
Bildigenkänningstekniken som ligger till grund för dagens autonoma bilar och flygdrönare beror på artificiell intelligens:datorerna lär sig i huvudsak att känna igen föremål som en hund, en fotgängare som korsar gatan eller en stannad bil. Problemet är att datorerna som kör algoritmerna för artificiell intelligens för närvarande är för stora och långsamma för framtida applikationer som handhållen medicinsk utrustning.
Nu, forskare vid Stanford University har tagit fram en ny typ av artificiellt intelligent kamerasystem som kan klassificera bilder snabbare och mer energieffektivt, och som en dag kan byggas tillräckligt liten för att bäddas in i själva enheterna, något som inte är möjligt idag. Verket publicerades den 17 augusti Naturvetenskapliga rapporter .
"Den självkörande bilen du just passerade har en relativt stor, relativt långsam, energikrävande dator i bagageutrymmet, sa Gordon Wetzstein, en biträdande professor i elektroteknik vid Stanford, som ledde forskningen. Framtida applikationer kommer att behöva något mycket snabbare och mindre för att bearbeta bildströmmen, han sa.
Förbrukas genom beräkning
Wetzstein och Julie Chang, en doktorand och första författare på tidningen, tog ett steg mot den tekniken genom att slå ihop två typer av datorer till en, skapa en hybrid optisk-elektrisk dator designad speciellt för bildanalys.
Det första lagret av prototypkameran är en typ av optisk dator, som inte kräver den energikrävande matematiken för digital datoranvändning. Det andra lagret är en traditionell digital elektronisk dator.
Det optiska datorlagret fungerar genom att fysiskt förbehandla bilddata, filtrera det på flera sätt som en elektronisk dator annars skulle behöva göra matematiskt. Eftersom filtreringen sker naturligt när ljus passerar genom den anpassade optiken, detta lager arbetar med noll ineffekt. Detta sparar hybridsystemet mycket tid och energi som annars skulle förbrukas av beräkningar.
"Vi har lagt ut en del av matematiken för artificiell intelligens till optiken, " sa Chang.
Resultatet är betydligt färre beräkningar, färre samtal till minnet och mycket mindre tid att slutföra processen. Efter att ha hoppat över dessa förbearbetningssteg, den återstående analysen fortsätter till det digitala datorlagret med ett stort försprång.
"Miljontals beräkningar kringgås och allt sker med ljusets hastighet, " sa Wetzstein.
Snabbt beslutsfattande
I hastighet och precision, prototypen konkurrerar med befintliga datorprocessorer som endast är elektroniska och som är programmerade att utföra samma beräkningar, men med betydande beräkningskostnadsbesparingar.
Medan deras nuvarande prototyp, ordnade på en labbbänk, skulle knappast klassas som liten, forskarna sa att deras system en dag kan miniatyriseras för att passa i en handhållen videokamera eller en antenn drönare.
I både simuleringar och verkliga experiment, teamet använde systemet för att framgångsrikt identifiera flygplan, bilar, katter, hundar och mer inom naturliga bildinställningar.
"Någon framtida version av vårt system skulle vara särskilt användbar i tillämpningar för snabba beslut, som autonoma fordon, " sa Wetzstein.
Förutom att krympa prototypen, Wetzstein, Chang och kollegor vid Stanford Computational Imaging Lab tittar nu på sätt att få den optiska komponenten att göra ännu mer av förbearbetningen. Så småningom, deras mindre, snabbare teknik kan ersätta de datorer i bagageutrymmet som nu hjälper bilar, drönare och annan teknik lär sig känna igen världen omkring dem.