• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Kemi
    GPT-3 förvandlar kemisk forskning
    Kredit:CC0 Public Domain

    Artificiell intelligens växer till ett centralt verktyg inom kemisk forskning, och erbjuder nya metoder för att hantera komplexa utmaningar som traditionella tillvägagångssätt kämpar med. En undertyp av artificiell intelligens som har fått ökad användning inom kemi är maskininlärning, som använder algoritmer och statistiska modeller för att fatta beslut baserat på data och utföra uppgifter som den inte explicit har programmerats för.



    Men för att göra tillförlitliga förutsägelser kräver maskininlärning också stora mängder data, vilket inte alltid är tillgängligt inom kemisk forskning. Små kemiska datamängder ger helt enkelt inte tillräckligt med information för dessa algoritmer att träna på, vilket begränsar deras effektivitet.

    Forskare, i teamet av Berend Smit vid EPFL, har hittat en lösning i stora språkmodeller som GPT-3. Dessa modeller är förtränade på enorma mängder texter och är kända för sin breda förmåga att förstå och generera människoliknande text. GPT-3 utgör grunden för den mer populära artificiella intelligensen ChatGPT.

    Studien, publicerad i Nature Machine Intelligence , avslöjar ett nytt tillvägagångssätt som avsevärt förenklar kemisk analys med hjälp av artificiell intelligens. I motsats till den första skepsisen ställer metoden inte direkt GPT-3 kemiska frågor.

    "GPT-3 har inte sett det mesta av den kemiska litteraturen, så om vi ställer ChatGPT en kemisk fråga, är svaren vanligtvis begränsade till vad man kan hitta på Wikipedia", säger Kevin Jablonka, studiens huvudforskare.

    "Istället finjusterar vi GPT-3 med en liten datamängd omvandlad till frågor och svar, vilket skapar en ny modell som kan ge exakta kemiska insikter."

    Denna process innebär att GPT-3 matar ut en lista med frågor och svar. "Till exempel, för högentropilegeringar är det viktigt att veta om en legering förekommer i en enda fas eller har flera faser", säger Smit. "Den sammanställda listan med frågor och svar är av typen:Q='Är (namnet på högentropilegeringen) enfas?' A='Ja/Nej.'"

    Han fortsätter, "I litteraturen har vi hittat många legeringar vars svar är känt, och vi använde dessa data för att finjustera GPT-3. Det vi får tillbaka är en förfinad AI-modell som är tränad att bara svara på denna fråga. med ett ja eller nej."

    I tester svarade modellen, tränad med relativt få frågor och svar, korrekt på över 95 % av mycket olika kemiska problem, ofta överträffade noggrannheten hos toppmoderna maskininlärningsmodeller. "Poängen är att det här är lika enkelt som att göra en litteratursökning, vilket fungerar för många kemiska problem", säger Smit.

    En av de mest slående aspekterna av denna studie är dess enkelhet och snabbhet. Traditionella maskininlärningsmodeller kräver månader för att utvecklas och kräver omfattande kunskap. Däremot tar det tillvägagångssätt som utvecklats av Jablonka fem minuter och kräver noll kunskap.

    Implikationerna av studien är djupgående. Den introducerar en metod lika enkel som att genomföra en litteratursökning, tillämpbar på olika kemiska problem. Förmågan att formulera frågor som "Är utbytet av en [kemikalie] gjord med detta (recept) högt?" och få korrekta svar kan revolutionera hur kemisk forskning planeras och genomförs.

    I uppsatsen säger författarna:"Bredvid en litteratursökning kan frågan om en grundmodell (t.ex. GPT-3,4) bli ett rutinmässigt sätt att starta ett projekt genom att utnyttja den kollektiva kunskap som kodas i dessa grundmodeller." Eller, som Smit kortfattat uttrycker det, "Det här kommer att förändra hur vi gör kemi."

    Mer information: Kevin Maik Jablonka, Är GPT allt du behöver för lågdataupptäckt inom kemi?, Nature Machine Intelligence (2024). DOI:10.1038/s42256-023-00788-1

    Journalinformation: Nature Machine Intelligence

    Tillhandahålls av Ecole Polytechnique Federale de Lausanne




    © Vetenskap https://sv.scienceaq.com