Hur en AI tränad att läsa vetenskapliga artiklar kan förutsäga framtida upptäckter

Kredit:CC0 Public Domain

"Kan maskiner tänka?", frågade den berömda matematikern, kodbrytaren och datavetaren Alan Turing för nästan 70 år sedan. I dag, vissa experter tvivlar inte på att artificiell intelligens (AI) snart kommer att kunna utveckla den typ av allmän intelligens som människor har. Men andra hävdar att maskiner aldrig kommer att hålla måttet. Även om AI redan kan överträffa människor i vissa uppgifter – precis som miniräknare – kan de inte läras ut mänsklig kreativitet.

Trots allt, vår uppfinningsrikedom, som ibland drivs av passion och intuition snarare än logik och bevis, har gjort det möjligt för oss att göra spektakulära upptäckter – allt från vacciner till fundamentala partiklar. Visst kommer en AI aldrig att kunna konkurrera? Väl, det visar sig att de kan. En artikel som nyligen publicerades i Nature rapporterar att en AI nu har lyckats förutsäga framtida vetenskapliga upptäckter genom att helt enkelt extrahera meningsfull data från forskningspublikationer.

Språket har ett djupt samband med tänkande, och det har format mänskliga samhällen, relationer och, i sista hand, intelligens. Därför, det är inte förvånande att AI-forskningens heliga gral är den fullständiga förståelsen av mänskligt språk i alla dess nyanser. Natural Language Processing (NLP), som är en del av ett mycket större paraply som kallas maskininlärning, syftar till att bedöma, extrahera och utvärdera information från textdata.

Barn lär sig genom att interagera med omvärlden via försök och misstag. Att lära sig cykla innebär ofta några stötar och fall. Med andra ord, vi gör misstag och vi lär oss av dem. Det är precis så maskininlärning fungerar, ibland med lite extra "pedagogisk" input (övervakad maskininlärning).

Till exempel, en AI kan lära sig att känna igen objekt i bilder genom att bygga upp en bild av ett objekt från många individuella exempel. Här, en människa måste visa den bilder som innehåller föremålet eller inte. Datorn gör sedan en gissning om den gör det, och justerar sin statistiska modell efter gissningens noggrannhet, som människan bedömer. Men vi kan också låta datorprogrammet göra all relevant inlärning själv (oövervakad maskininlärning). Här, AI börjar automatiskt kunna upptäcka mönster i data. I vilket fall, ett datorprogram behöver hitta en lösning genom att utvärdera hur fel det är, och försök sedan justera det för att minimera sådana fel.

Anta att vi vill förstå några egenskaper relaterade till ett specifikt material. Det självklara steget är att söka information från böcker, webbsidor och andra lämpliga resurser. Dock, detta är tidskrävande, eftersom det kan innebära timmar av webbsökning, läsa artiklar och speciallitteratur. NLP kan, dock, hjälp oss. Via sofistikerade metoder och tekniker, datorprogram kan identifiera begrepp, ömsesidiga relationer, allmänna ämnen och specifika egenskaper från stora textdatauppsättningar.

I den nya studien, en AI lärde sig att hämta information från vetenskaplig litteratur via oövervakat lärande. Detta har anmärkningsvärda konsekvenser. Än så länge, de flesta av de befintliga automatiserade NLP-baserade metoderna övervakas, kräver input från människor. Trots att det är en förbättring jämfört med ett rent manuellt tillvägagångssätt, detta är fortfarande ett arbetsintensivt arbete.

Dock, i den nya studien, forskarna skapade ett system som kunde identifiera och extrahera information oberoende. Den använde sofistikerade tekniker baserade på statistiska och geometriska egenskaper hos data för att identifiera kemiska namn, begrepp och strukturer. Detta baserades på cirka 1,5 miljoner sammandrag av vetenskapliga artiklar om materialvetenskap.

Ett maskininlärningsprogram klassificerade sedan ord i data baserat på specifika funktioner som "element", "energi" och "bindemedel". Till exempel, "värme" klassades som en del av "energi", och "gas" som "element". Detta hjälpte till att koppla vissa föreningar med typer av magnetism och likhet med andra material, bland annat, ger en inblick i hur orden hängde ihop utan att någon mänsklig inblandning krävdes.

Vetenskapliga upptäckter

Denna metod kan fånga komplexa relationer och identifiera olika lager av information, vilket skulle vara praktiskt taget omöjligt att utföra av människor. Det gav insikter i god tid jämfört med vad forskare kan förutsäga för tillfället. Faktiskt, AI kunde rekommendera material för funktionella applikationer flera år innan de faktiskt upptäcktes. Det fanns fem sådana förutsägelser, allt baserat på tidningar publicerade före år 2009. Till exempel, AI lyckades identifiera ett ämne som kallas CsAgGa2Se4as som ett termoelektriskt material, som forskare upptäckte först 2012. Så om AI hade funnits 2009, det kunde ha påskyndat upptäckten.

Det gjorde förutsägelsen genom att koppla samman föreningen med ord som "kalkogenid" (material som innehåller "kalkogenelement" som svavel eller selen), "optoelektroniska" (elektroniska enheter som källa, upptäcka och kontrollera ljus) och "solcellsapplikationer". Många termoelektriska material delar sådana egenskaper, och AI var snabb med att visa det.

Detta tyder på att latent kunskap om framtida upptäckter i stor utsträckning är inbäddad i tidigare publikationer. AI-system blir mer och mer oberoende. Och det finns inget att frukta. De kan hjälpa oss enormt att navigera genom den enorma mängden data och information, som ständigt skapas av mänskliga aktiviteter. Trots farhågor relaterade till integritet och säkerhet, AI förändrar våra samhällen. Jag tror att det kommer att leda oss att fatta bättre beslut, förbättra vårt dagliga liv och i slutändan göra oss smartare.

Den här artikeln är återpublicerad från The Conversation under en Creative Commons-licens. Läs originalartikeln.

Ny referensstandard för bedömning av solprognos föreslås

Daimler säger att han ska betala 870 miljoner euro i böter för återkallelser av diesel

Elektronik

Personlighet spelar nyckelroll i huruvida utvecklare kan bidra till projekt med öppen källkod

Flygbolag ska intensifiera kampen mot människohandel

Vindtunneltester kan hjälpa drakar att bli en högflygare med ren energi

Vetenskap

Stenkolstjärtätningsmedel är en viktig källa till PAH-kontamination i de stora sjöarnas bifloder

Omvänd metalloxidbur kan sortera koldioxid från kolmonoxid

Hur mycket skulle du lita på ett autonomt fordon?