Kredit:Gearstd/Shutterstock
Siffror ligger ganska högt upp på listan över vad en dator kan göra bra. Medan människor ofta kämpar för att dela en restaurangräkning, en modern dator kan göra miljontals beräkningar på bara en sekund. Människor, dock, har en medfödd och intuitiv sifferkänsla som hjälpte oss, bland annat, att bygga datorer i första hand.
Till skillnad från en dator, en människa vet när man tittar på fyra katter, fyra äpplen och symbolen 4 att de alla har en sak gemensamt – det abstrakta begreppet "fyra" – utan att ens behöva räkna dem. Detta illustrerar skillnaden mellan det mänskliga sinnet och maskinen, och hjälper till att förklara varför vi inte ens är nära att utveckla AI med den breda intelligens som människor har. Men nu en ny studie, publicerad i Science Advances, rapporterar att en AI spontant har utvecklat en människoliknande talkänsla.
För att en dator ska räknas, vi måste tydligt definiera vad det är vi vill räkna. När vi väl tilldelar lite minne för att underhålla räknaren, vi kan ställa in den på noll och sedan lägga till ett objekt varje gång vi hittar något vi vill spela in. Detta innebär att datorer kan räkna tid (signaler från en elektronisk klocka), ord (om de lagras i datorns minne) och till och med objekt i en digital bild.
Denna sista uppgift, dock, är lite utmanande, eftersom vi måste berätta för datorn exakt hur föremålen ser ut innan den kan räkna dem. Men föremål ser inte alltid likadana ut – variation i belysning, position och ställning har inverkan, samt eventuella skillnader i konstruktion mellan enskilda exempel.
Alla framgångsrika beräkningsmetoder för att upptäcka objekt i bilder fungerar genom att bygga upp en slags statistisk bild av ett objekt från många individuella exempel – en typ av lärande. Detta gör att datorn kan känna igen nya versioner av objekt med en viss grad av tillförsikt. Utbildningen innebär att ge exempel som gör, eller inte, innehålla objektet. Datorn gör sedan en gissning om den gör det, och justerar sin statistiska modell efter gissningens noggrannhet – bedömd av en människa som övervakar inlärningen.
Moderna AI-system börjar automatiskt kunna upptäcka objekt när de förses med miljontals träningsbilder av alla slag – precis som människor gör. Dessa oövervakade inlärningssystem märker gradvis delar av elementen i bilderna som ofta är närvarande samtidigt, och bygga upp lager på lager av mer komplicerade likheter.
Kredit:Sarah Holmlund/Shutterstock
Ta att känna igen äpplen som ett exempel. Eftersom bilder som innehåller alla möjliga former presenteras för systemet, det börjar först lägga märke till grupper av pixlar som utgör horisontella och vertikala linjer, och vänster och höger kurvor. De finns i äpplen, ansikten, katter och bilar, så det gemensamma, eller abstraktioner, hittas tidigt. Den inser så småningom att vissa kurvor och linjer ofta finns tillsammans i äpplen – och utvecklar en ny, djupare abstraktion som representerar en klass av objekt:äpplen, I detta fall.
Djup lärning
Denna naturliga uppkomst av abstraktioner på hög nivå är ett av de mest spännande resultaten av maskininlärningstekniken som kallas djupa neurala nätverk, som i någon mening fungerar på liknande sätt som den mänskliga hjärnan. "Djupet" kommer från de många lagren i nätverket - när informationen går djupare in i nätverket, de gemensamma fynden blir mer abstrakta. På det här sättet, nätverk skapas med element som är starkt aktiva när ingången liknar vad den har upplevt tidigare. De mest abstrakta sakerna dyker upp på de djupaste nivåerna – det här är katter, ansikten och äpplen snarare än vertikala linjer eller cirklar.
När ett AI-system kan känna igen äpplen, du kan sedan använda den för att räkna hur många det finns. Toppen, men det är inte riktigt hur du eller jag skulle räkna äpplen. Vi har ett extremt djupt begrepp om "antal" - hur många av något det finns. Istället för att bara vara aktiv när ett föremål är närvarande, delar av vår hjärna aktiveras beroende på mängden föremål som finns. Det betyder att vi kan titta på ett gäng äpplen och veta att det finns fyra utan att faktiskt räkna var och en.
Faktiskt, många djur kan också göra detta. Det beror på att denna känsla av numerositet är en användbar egenskap för överlevnad och reproduktion i många olika situationer - ta till exempel bedömningen av storleken på grupper av rivaler eller byten.
Konstgjorda neuroner inställda på önskat antal prickar. Kredit:Andreas Nieder
Emergent egenskaper
I den nya studien, ett djupt neuralt nätverk som tränades för enkel visuell objektdetektering utvecklade spontant denna typ av talkänsla. Forskarna upptäckte att specifika enheter inom nätverket plötsligt "inställda" till ett abstrakt nummer - precis som riktiga nervceller i hjärnan kan svara. Den insåg att en bild på fyra äpplen liknar en bild på fyra katter – eftersom de har "fyra" gemensamt.
En riktigt spännande sak med den här forskningen är att den visar att våra nuvarande principer för lärande är ganska grundläggande. Några av de mest höga aspekterna av tänkande som människor och djur visar är djupt relaterade till världens struktur, och vår visuella upplevelse av det.
Det antyder också att vi kan vara på rätt väg för att uppnå en mer omfattande, artificiell intelligens på mänsklig nivå. Att tillämpa denna typ av inlärning på andra uppgifter-kanske tillämpa den på signaler som uppstår över en tid snarare än över pixlar i en bild-kan ge maskiner med ännu mer mänskliga egenskaper. Saker vi en gång trodde var grundläggande för att vara människa – musikalisk rytm till exempel, eller till och med en känsla av kausalitet – undersöks nu ur detta nya perspektiv.
När vi fortsätter att upptäcka mer om att bygga konstgjorda inlärningstekniker, och hitta nya sätt att förstå hjärnan hos levande organismer, vi låser upp fler av intelligenta mysterier, adaptivt beteende.
Det är en lång väg kvar, och många andra dimensioner som vi behöver utforska, men det är klart att förmågan att se på världen och utarbeta dess struktur utifrån erfarenhet är en viktig del av det som gör människor så anpassningsbara. Det råder ingen tvekan om att det kommer att vara en nödvändig komponent i alla AI -system som har potential att utföra olika och komplexa uppgifter som människor kan.
Denna artikel publiceras från The Conversation under en Creative Commons -licens. Läs originalartikeln.