• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Kemi
    Evolutionär algoritm genererar skräddarsydda molekylära fingeravtryck
    Grafisk abstrakt. Kredit:Chem (2024). DOI:10.1016/j.chempr.2024.02.004

    Ett team under ledning av professor Frank Glorius från Institutet för organisk kemi vid universitetet i Münster har utvecklat en evolutionär algoritm som identifierar strukturerna i en molekyl som är särskilt relevanta för en respektive fråga och använder dem för att koda molekylernas egenskaper för olika maskinlärande modeller.



    Metoden är också lämplig för maskinell förutsägelse av kvantkemiska egenskaper och molekylers toxicitet. Den kan appliceras på vilken molekylär datauppsättning som helst och kräver ingen expertkunskap om de underliggande sambanden.

    Artificiell intelligens och maskininlärning blir mer och mer relevant i vardagen — och detsamma gäller kemi. Organiska kemister är till exempel intresserade av hur maskininlärning kan hjälpa till att upptäcka och syntetisera nya molekyler som är effektiva mot sjukdomar eller är användbara på andra sätt.

    Den nya algoritmen som utvecklats av Glorius team söker efter optimala molekylära representationer baserade på evolutionens principer, med hjälp av mekanismer som reproduktion, mutation och selektion. Beroende på modellen och den givna frågan skapas skräddarsydda "molekylära fingeravtryck", som kemisterna använde i sin studie för att förutsäga kemiska reaktioner med överraskande noggrannhet.

    Metoden, publicerad i tidskriften Chem , är också lämplig för att förutsäga kvantkemiska egenskaper och molekylers toxicitet.

    För att kunna använda maskininlärning måste forskarna först omvandla molekylerna till en datorläsbar form. Många forskargrupper har redan tagit itu med detta problem, och följaktligen finns det olika sätt att utföra denna uppgift. Det är dock svårt att förutsäga vilken av de tillgängliga metoderna som är bäst lämpade för att svara på en specifik fråga – till exempel för att avgöra om en kemisk förening är skadlig för människor.

    Den nya algoritmen är utformad för att hjälpa till att hitta det optimala molekylära fingeravtrycket i varje enskilt fall. För att göra detta väljer algoritmen gradvis de molekylära fingeravtrycken som uppnår de bästa resultaten i förutsägelsen från många slumpmässigt genererade molekylära fingeravtryck.

    "I enlighet med naturens exempel använder vi mutationer, det vill säga slumpmässiga förändringar av enskilda komponenter i fingeravtrycken, eller rekombinerar komponenter av två fingeravtryck", förklarar doktoranden Felix Katzenburg.

    "I andra studier beskrivs molekyler ofta av kvantifierbara egenskaper som har valts ut och beräknats av människor", tillägger Glorius.

    "Eftersom algoritmen vi utvecklade automatiskt identifierar de relevanta molekylära strukturerna, finns det inga systematiska fördomar orsakade av mänskliga experter."

    En annan fördel är att metoden för kodning gör det möjligt att förstå varför en modell gör en viss förutsägelse. Det är till exempel möjligt att dra slutsatser om vilka delar av en molekyl som positivt eller negativt påverkar förutsägelsen av hur en reaktion skulle utspela sig, vilket gör det möjligt för forskare att ändra de relevanta strukturerna på ett riktat sätt.

    Münster-teamet fann att deras nya metod inte alltid gav de mest optimala resultaten.

    "När betydande mänsklig expertis har lagts ner på att välja särskilt relevanta molekylära egenskaper eller mycket stora mängder data finns tillgängliga, har andra metoder som neurala nätverk ibland fördelen", säger Katzenburg.

    Ett av studiens primära mål var dock att utveckla en metod för att koda molekyler som kan appliceras på vilken molekylär datauppsättning som helst och som inte kräver expertkunskap om de underliggande sambanden.

    Mer information: Philipp M. Pflüger et al, An evolutionary algorithm for interpretable molecular representations, Chem (2024). DOI:10.1016/j.chempr.2024.02.004

    Journalinformation: Chem

    Tillhandahålls av University of Münster




    © Vetenskap https://sv.scienceaq.com