Kredit:Mohamed Elhoseiny
Genom att lära sig att avvika från känd information på samma sätt som människor gör, en "fantasi"-algoritm för artificiell intelligens (AI) kan identifiera tidigare osynliga objekt från skrivna beskrivningar.
Algoritmen, utvecklad av KAUST-forskaren Mohamed Elhoseiny i samarbete med Mohamed Elfeki från University of Central Florida, banar väg för konstgjord fantasi och automatiserad klassificering av nya växt- och djurarter.
"Fantasi är en av nyckelegenskaperna hos mänsklig intelligens som gör att vi inte bara kan skapa kreativa produkter som konst och musik, men också för att förstå den visuella världen, " förklarar Elhoseiny.
Artificiell intelligens förlitar sig på träningsdata för att utveckla dess förmåga att känna igen objekt och svara på sin omgivning. Människor utvecklar också denna förmåga genom ackumulerad erfarenhet, men människor kan göra något som AI inte kan. De kan intuitivt härleda en sannolik klassificering för ett tidigare oupptäckt föremål genom att föreställa sig hur något måste se ut från en skriftlig beskrivning eller genom slutledning från något liknande. I AI, denna förmåga att föreställa sig det okända blir allt viktigare när tekniken rullas ut i komplexa verkliga tillämpningar där felklassificering eller feligenkänning av nya objekt kan visa sig vara katastrofala.
Viktigt är också den stora mängden data som behövs för att tillförlitligt träna AI för den verkliga världen. Det är omöjligt att träna AI med bilder av till och med en bråkdel av de kända arterna av växter och djur i världen i alla deras permutationer, än mindre de otaliga oupptäckta eller oklassificerade arterna.
Elhoseiny och Elfekis forskning syftade till att utveckla en så kallad Zero-shot learning (ZSL) algoritm för att hjälpa till med igenkännandet av tidigare osynliga kategorier baserade på beskrivningar på klassnivå utan träningsexempel.
"Vi modellerade den visuella inlärningsprocessen för "osynliga" kategorier genom att relatera ZSL till mänsklig kreativitet, att observera att ZSL handlar om att känna igen det osedda medan kreativitet handlar om att skapa en "likvärdig osedd, " säger Elhoseiny.
I kreativitet, något nytt men tilltalande eller "snällt" måste skilja sig från tidigare konst, men inte så olika att det är oigenkännligt. På samma sätt, Elhoseiny och Elfeki modellerade noggrant en inlärningssignal som induktivt uppmuntrar avvikelser från sett klasser, ändå inte drivit så långt att den föreställda klassen blir orealistisk och förlorar kunskapsöverföring från sedda klasser. Den resulterande algoritmen visade en konsekvent förbättring jämfört med de senaste riktmärkena för ZSL.
"En av de möjliga tillämpningarna av vårt tillvägagångssätt är att identifiera okända arter, "säger Elhoseiny." AI som drivs med denna teknik kan hjälpa till att rapportera artobservationer utan bilder, bara med språkbeskrivningar."