IBM Research släpper datauppsättningen Diversity in Faces för att främja studier av rättvisa i system för ansiktsigenkänning

science >> Vetenskap > >> Elektronik

Kredit:IBM

Har du någonsin blivit orättvist behandlad? Hur fick det dig att känna? Förmodligen inte för bra. De flesta är generellt överens om att en rättvisare värld är en bättre värld, och våra AI-forskare kunde inte vara mer överens. Det är därför vi utnyttjar vetenskapens kraft för att skapa AI-system som är mer rättvisa och exakta.

Många av våra senaste framsteg inom AI har skapat anmärkningsvärda möjligheter för datorer att utföra allt mer sofistikerade och viktiga uppgifter, som att översätta tal över språk för att överbrygga kommunikation mellan kulturer, förbättra komplexa interaktioner mellan människor och maskiner, och automatiskt känna igen innehållet i videon för att underlätta säkerhetsapplikationer.

Mycket av kraften med AI idag kommer från användningen av datadriven djupinlärning för att träna allt mer exakta modeller genom att använda växande mängder data. Dock, styrkan i dessa tekniker kan också vara en svaghet. AI-systemen lär sig vad de lärs ut, och om de inte lärs ut med robusta och olika datauppsättningar, noggrannhet och rättvisa kan vara i fara. Av den anledningen, IBM, tillsammans med AI-utvecklare och forskarvärlden, måste tänka på vilken data vi använder för träning. IBM är fortfarande engagerad i att utveckla AI-system för att göra världen mer rättvis.

Utmaningen med att träna AI manifesteras på ett mycket uppenbart och djupgående sätt med teknik för ansiktsigenkänning. I dag, det kan finnas svårigheter att göra ansiktsigenkänningssystem som uppfyller rättvisa förväntningar. Kärnan i problemet ligger inte i själva AI-tekniken, i sig, men med hur de AI-drivna ansiktsigenkänningssystemen tränas. För att ansiktsigenkänningssystemen ska fungera som önskat – och resultaten ska bli allt mer exakta – måste träningsdata vara varierande och erbjuda en bred täckning. Till exempel, träningsdatauppsättningarna måste vara tillräckligt stora och olika så att tekniken lär sig alla sätt på vilka ansikten skiljer sig åt för att exakt känna igen dessa skillnader i en mängd olika situationer. Bilderna måste spegla fördelningen av drag i ansikten vi ser i världen.

Kredit:IBM

Hur mäter och säkerställer vi mångfald för mänskliga ansikten? Å ena sidan, vi är bekanta med hur ansikten skiljer sig åt beroende på ålder, kön, och hudton, och hur olika ansikten kan variera mellan vissa av dessa dimensioner. Mycket av fokus på ansiktsigenkänningsteknik har varit på hur väl den presterar inom dessa attribut. Men, som tidigare studier har visat, dessa attribut är bara en pusselbit och inte helt tillräckliga för att karakterisera hela mångfalden av mänskliga ansikten. Mått som ansiktssymmetri, ansiktskontrast, ställningen ansiktet är i, längden eller bredden på ansiktets egenskaper (ögon, näsa, panna, etc.) är också viktiga.

I dag, IBM Research släpper en ny stor och mångsidig datauppsättning som heter Diversity in Faces (DiF) för att främja studiet av rättvisa och noggrannhet i ansiktsigenkänningsteknik. Den första i sitt slag som är tillgänglig för det globala forskarsamhället, DiF tillhandahåller en datauppsättning med kommentarer av 1 miljon mänskliga ansiktsbilder. Genom att använda allmänt tillgängliga bilder från YFCC-100M Creative Commons datamängd, vi kommenterade ansiktena med hjälp av 10 väletablerade och oberoende kodningsscheman från den vetenskapliga litteraturen. [1-10] Kodningsschemana inkluderar huvudsakligen objektiva mått på mänskliga ansikten, såsom kraniofaciala egenskaper, såväl som mer subjektiva kommentarer, såsom människomärkta förutsägelser av ålder och kön. Vi tror att genom att extrahera och släppa dessa ansiktskodningsanteckningar på ett stort dataset med 1 miljon bilder av ansikten, vi kommer att påskynda studiet av mångfald och täckning av data för AI-ansiktsigenkänningssystem för att säkerställa mer rättvisa och exakta AI-system. Dagens release är helt enkelt det första steget.

Vi tror att DiF-datauppsättningen och dess 10 kodningsscheman erbjuder en startpunkt för forskare runt om i världen som studerar tekniken för ansiktsigenkänning. De 10 ansiktskodningsmetoderna inkluderar kraniofacial (t.ex. huvudlängd, näsans längd, pannhöjd), ansiktsförhållanden (symmetri), visuella attribut (ålder, kön), och posering och upplösning, bland andra. Dessa system är några av de starkaste som identifierats av den vetenskapliga litteraturen, bygga en solid grund för vår samlade kunskap.

Vår första analys har visat att DiF-datauppsättningen ger en mer balanserad distribution och bredare täckning av ansiktsbilder jämfört med tidigare datauppsättningar. Vidare, de insikter som erhållits från den statistiska analysen av de 10 initiala kodningsscheman på DiF-datauppsättningen har främjat vår egen förståelse av vad som är viktigt för att karakterisera mänskliga ansikten och gjort det möjligt för oss att fortsätta viktig forskning om sätt att förbättra ansiktsigenkänningstekniken.

Datauppsättningen är tillgänglig idag för det globala forskarsamhället på begäran. IBM är stolta över att göra detta tillgängligt och vårt mål är att hjälpa till att främja vår kollektiva forskning och bidra till att skapa AI-system som är mer rättvisa.

Medan IBM Research har åtagit sig att fortsätta studera och undersöka mer rättvisa system för ansiktsigenkänning, vi tror inte att vi kan göra det ensamma. Med dagens release, vi uppmanar andra att bidra till den växande mängden forskning och främja denna viktiga vetenskapliga agenda.

För att begära tillgång till DiF-datauppsättningen, besök vår webbsida. För att lära dig mer om DiF, läs vår tidning, "Mångfald i ansikten."

Den här historien återpubliceras med tillstånd av IBM Research. Läs originalberättelsen här.

Japans ANA beställer 30 Boeing, 18 Airbus-plan

Huawei förbud skyllas på att det nya australiska mobilnätet avskaffats

Elektronik