Forskare från Skoltech Center for Computational and Data-intensive Science and Engineering (CDISE) och Helmholtz Munich Center for Environmental Health (HMGU, Tyskland) har skapat ett neuralt nätverk för att visualisera det kemiska utrymmet hos föreningar som kan vara av potentiellt värde för läkemedelsindustrin. Den nya metoden kommer att bidra till att skapa nya kemiska föreningar och navigera i utrymmet för de befintliga kemikalierna. Resultaten av studien publicerades i RSC Advances.
Kemister måste ofta slita sig igenom enorma databaser som innehåller tiotals eller till och med hundratusentals kemiska strukturer för att välja ut de bästa kandidaterna. Att göra så, de behöver veta vilka klasser av föreningar som databasen innehåller. Dock, att gå igenom tusentals molekyler är en mödosam uppgift, vilket skulle vara mycket lättare om molekylerna avbildades som prickar och placerades på ett plan eller i rymden, med liknande molekyler hopkurade. Detta skulle göra det möjligt att studera det kemiska rummet med ett enkelt verktyg på ungefär samma sätt som geografen använder digitala kartor i olika skalor för att se en större bild eller zooma in på ett visst område. Men här är problemet:Hur skulle algoritmen veta var den ska placera molekylerna om verktyget inte har någon kunskap om kemi?
En gemensam grupp forskare från CDISE (Dmitry Karlov, Sergey Sosnin och Maxim Fedorov) och HMGU (Igor Tetko) tillämpade AI-metoder för att extrahera information direkt från data, och kopplade det djupa neurala nätverket med den populära t-SNE-dimensionsreduktionsmetoden för att skapa ett neuralt nätverk som kan generera en 2D-vy av föreningen på ett plan baserat på föreningens flerdimensionella struktur som tas emot som input. Den nya metoden placerar molekyler med liknande egenskaper nära varandra, så att föreningarna kan grupperas i klasser efter deras egenskaper. Författarna till studien tränade sitt neurala nätverk på miljontals föreningar med känd biologisk aktivitet.
"Vi anpassade t-SNE-metoden för att möjliggöra visualisering av det kemiska utrymmet hos föreningar med farmaceutisk potential genom att träna det djupa neurala nätverket och välja enkla deskriptorer och ett mått för att beräkna avstånd i ett flerdimensionellt utrymme. Vi visade också att detta tillvägagångssätt gör det möjligt att spara mer information jämfört med andra dimensionsminskningsmetoder, samtidigt som den är i nivå med PCA när det gäller hastighet, " säger Skoltech-forskaren och första författaren till studien Dmitry Karlov.
I framtiden, forskarna planerar att utveckla en serie verktyg för kemister och farmaceuter för att se arrangemanget av nya, outforskade föreningar i förhållande till de som redan studerats och beskrivits i litteraturen. Detta kommer att påskynda FoU-fasen i sökandet efter nya läkemedel.