Den här bilden från augusti 2017 från Shamima Khatoon visar Khatoon i New Delhi. Khatoons jobb med att kommentera bilar, körfältsmarkörer och trafikljus vid en kvinnlig utpost för datamärkningsföretaget iMerit i Metiabruz, Indien, representerar den enda chans hon har att arbeta utanför hemmet i en konservativ muslimsk region i Indien. (Mushtari Fatma Zarin / Courtesy of Shamima Khatoon via AP)
Det finns en smutsig liten hemlighet om artificiell intelligens:Den drivs av hundratusentals riktiga människor.
Från makeupartister i Venezuela till kvinnor i konservativa delar av Indien, människor runt om i världen gör den digitala motsvarigheten till handarbete — ritar lådor runt bilar på gatufoton, tagga bilder, och transkribera stycken av tal som datorer inte riktigt kan urskilja.
Sådan data matas direkt in i "maskininlärning"-algoritmer som hjälper självkörande bilar att slingra sig genom trafiken och låter Alexa räkna ut att du vill ha lamporna tända. Många sådana tekniker skulle inte fungera utan enorma mängder av denna mänskliga märkta data.
Dessa repetitiva uppgifter betalar öre styck. Men i bulk, detta arbete kan erbjuda en anständig lön i många delar av världen – även i USA. Denna spirande men i stort sett osedda stugindustri representerar grunden för en teknik som kan förändra mänskligheten för alltid:AI som kommer att driva oss runt, exekvera verbala kommandon utan brister, och, eventuellt, en dag tänka själv.
___
Denna mänskliga insatsindustri har länge uppfostrats av sökmotorerna Google och Bing, som i mer än ett decennium har använt människor för att bedöma träffsäkerheten i sina resultat. Sedan 2005, Amazons Mechanical Turk-tjänst, som matchar frilansarbetare med tillfälliga onlinejobb, har också gjort crowd-sourced datainmatning tillgänglig för forskare över hela världen.
På senare tid, investerare har hällt tiotals miljoner dollar i startups som Mighty AI och CrowdFlower, som utvecklar programvara som gör det lättare att märka foton och annan data, även på smartphones.
Denna odaterade kombination av bilder från CrowdFlower visar före och efter renderingar från CrowdFlowers Human-in-the-Loop-teknik, som tillhandahåller sofistikerade verktyg som gör det möjligt för en person att märka och strukturera varje del av ett normalt foto och omvandla det till strukturerad "träningsdata" som ett AI-system kan förstå och tolka. (CrowdFlower via AP)
Riskkapitalisten S. "Soma" Somasegar säger att han ser "möjligheter för miljarder dollar" när det gäller att tillgodose behoven hos maskininlärningsalgoritmer. Hans företag, Madrona Venture Group, investerat i Mighty AI. Människor kommer att vara i slingan "under en lång tid, lång, lång tid framöver, " han säger.
Noggrann märkning kan göra skillnaden mellan en självkörande bil som skiljer mellan himlen och sidan av en lastbil – en skillnad som Teslas Model S misslyckades i det första kända dödsfallet som involverade självkörande system 2016.
"Vi bygger inte ett system för att spela ett spel, vi bygger ett system för att rädda liv, " säger Mighty AI VD Daryn Nakhuda.
___
Marjorie Aguilar, en 31-årig frilansande makeupartist i Maracaibo, Venezuela, spenderar fyra till sex timmar om dagen på att rita lådor runt trafikföremål för att hjälpa till att träna självkörande system för Mighty AI.
Hon tjänar ungefär 50 cent i timmen, men i ett krisdrabbat land med skenande inflation, bara några timmars arbete kan betala en månadshyra i bolivar.
"Det låter inte som mycket pengar, men för mig är det ganska bra, " säger hon. "Du kan föreställa dig hur viktigt det är för mig att få betalt i amerikanska dollar."
Det här odaterade fotot från Marjorie Aguilar visar Aguilar i Maracaibo, Venezuela. Aguilar, en frilansande makeupartist i Maracaibo, spenderar fyra till sex timmar om dagen på att rita lådor runt trafikföremål för att hjälpa till att träna självkörande system för Mighty AI. (Med tillstånd av Marjorie Aguilar via AP)
Aria Khrisna, en 36-årig trebarnspappa i Tegal, Indonesien, säger att göra saker som att lägga till ordtaggar på klädbilder på webbplatser som eBay och Amazon betalar honom cirka 100 USD i månaden, ungefär hälften av sin inkomst.
Och för 25-åriga Shamima Khatoon, hennes jobb att kommentera bilar, körfältsmarkörer och trafikljus vid en kvinnlig utpost för datamärkningsföretaget iMerit i Metiabruz, Indien, representerar den enda chans hon har att arbeta utanför hemmet i sitt konservativa muslimska samfund.
"Det är en bra plattform för att öka dina kunskaper och stödja din familj, " hon säger.
___
Stora biltillverkare som Toyota, Nissan och Ford, Åkande företag som Uber och andra teknikjättar som Alphabet Inc.s Waymo betalar mängder med etiketter, ofta via tredjepartsleverantörer.
Fördelarna med större noggrannhet kan vara omedelbara.
På InterContinental Hotels Group, varje samtal som dess digitala assistent Amelia kan ta från en människa sparar $5 till $10, säger informationsteknikchefen Scot Whigham.
I denna 8 nov. 2017, foto Jessica McShane, anställd på Interactions Corp., övervakar kommunikation från person till dator, hjälpa datorer att förstå vad en människa säger, i rummet "avsiktsanalys" vid företagets huvudkontor i Franklin, Mass. När en dator inte kan ringa ett kundsamtal till Hyatt Hotels-kedjan, ett ljudavsnitt skickas till AI-drivet callcenter Interactions. Där, medan kunden väntar i telefonen, en analytiker transkriberar allt från felhörda siffror till svordomar och anger snabbt hur datorn ska svara. (AP Photo/Steven Senne)
När Amelia misslyckas, programmet lyssnar medan ett samtal omdirigeras till en av cirka 60 servicedesk-arbetare. Den lär sig av deras svar och provar tekniken vid nästa samtal, frigöra mänskliga anställda att göra andra saker.
"Vi har förändrat de jobben, " säger Whigham.
När en dator inte kan ringa ett kundsamtal till Hyatt Hotels-kedjan, ett ljudutdrag skickas till AI-drivet callcenter Interaktioner i en gammal tegelbyggnad i Franklin, Massachusetts.
Där, medan kunden väntar i telefonen, en av ett rum fullt med hörlursbärande "avsiktsanalytiker" transkriberar allt från felhörda siffror till svordomar och hänvisar snabbt datorn hur den ska svara.
Den informationen matas tillbaka in i systemet. "Nästa gång, vi har större chans att bli framgångsrika, " säger Robert Nagle, Interactions tekniska chef.
___
Forskare har försökt hitta lösningar på mänskliga märkta data, men resultaten är ofta otillräckliga.
I denna 8 nov. 2017, Foto, Jessica McShane, anställd på Interactions Corp., förgrund, övervakar kommunikation från person till dator, hjälpa datorer att förstå vad en människa säger, i rummet "avsiktsanalys" vid företagets huvudkontor i Franklin, Mass. "Denna informationen används för att återkoppla in i systemet med hjälp av maskininlärning för att förbättra vår modell, sa Robert Nagle, Interactions tekniska chef. "Nästa gång, vi har en bättre chans att bli framgångsrika." (AP Photo/Steven Senne)
I ett projekt som använde Google Street View-bilder av parkerade bilar för att uppskatta den demografiska sammansättningen av stadsdelar, dåvarande Stanford-forskaren Timnit Gebru försökte träna sin AI genom att skrapa Craigslist-bilder på bilar till salu som var märkta av deras ägare.
Men produktbilderna såg inte ut som bilbilderna i Street View, och programmet kunde inte känna igen dem. I slutet, hon säger, hon spenderade 35 dollar, 000 för att anlita experter på bilhandlare för att märka hennes data.
Behovet av mänskliga etiketter är "enormt" och "dynamiskt, säger Robin Bordoli, VD för märkningsteknikföretaget CrowdFlower. "Du kan inte lita på algoritmen till 100 procent."
___
Just nu, att ta reda på hur man får datorer att lära sig utan så kallad "ground truth"-data från människor förblir en öppen forskningsfråga.
Trevor Darrell, en maskininlärningsexpert vid University of California Berkeley, säger att han förväntar sig att det kommer att ta fem till tio år innan datoralgoritmer kan lära sig att prestera utan behov av mänsklig märkning.
Enbart hans grupp spenderar hundratusentals dollar per år på att betala människor för att kommentera bilder. "Just nu, om du säljer en produkt och vill ha perfektion, det skulle vara försumligt att inte investera pengarna i den typen av anteckningar, " han säger.
Den här onsdagen, 29 november, 2017, foto från Aria Khrisna visar Krishna och hans 3-årige son Raka. Khrisna, en 36-årig trebarnspappa i Tegal, Indonesien, säger att göra saker som att lägga till ordtaggar på klädbilder på webbplatser som eBay och Amazon betalar honom cirka 100 USD i månaden, ungefär hälften av sin inkomst. (Indah Nurul Hidayah/Aria Khrisna via AP)
Flera företag som Alphabets Waymo och speltillverkaren Unity Technologies utvecklar simulerade världar för att träna sina algoritmer i kontrollerade scenarier där varje objekt är fördefinierat.
För det mesta, även företag som försöker pressa människor ur kretsen förlitar sig fortfarande på dem.
CloudSight, till exempel, erbjuder webbplats- och apputvecklare ett praktiskt verktyg för att ladda upp ett foto och få några ord tillbaka som beskriver det. Återförsäljaren Kohl's använder tjänsten för en visuell sökfunktion "Snap and Shop" på sin app.
Men det är inte bara ett fint datorprogram som spottar tillbaka svar. Om algoritmen inte har ett bra svar, en av dess 800 anställda på platser som Indien, Sydostasien eller Afrika skriver in svaret i realtid.
"Vi vill vara de som kan märka vilken bild som helst utan mänsklig inblandning, säger Ian Parnes, CloudSights chef för affärsutveckling. "Hur lång tid det kommer att ta är någons gissning."
© 2018 The Associated Press. Alla rättigheter förbehållna.