Kredit:Pixabay/CC0 Public Domain
En algoritm som designats av forskare från Carnegie Mellon -universitetets avdelning för beräkningsbiologi och St Petersburg State University i Ryssland kan hjälpa forskare att identifiera okända molekyler. Algoritmen, kallad MolDiscovery, använder masspektrometridata från molekyler för att förutsäga identiteten av okända ämnen, berätta för forskare tidigt i sin forskning om de har snubblat över något nytt eller bara återupptäckt något redan känt.
Denna utveckling kan spara tid och pengar i sökandet efter nya naturligt förekommande produkter som kan användas inom medicin.
"Forskare slösar mycket tid på att isolera molekyler som redan är kända, i huvudsak återupptäcker penicillin, sa Hosein Mohimani, en biträdande professor och en del av forskargruppen. "Att upptäcka om en molekyl är känd eller inte tidigt kan spara tid och miljontals dollar, och kommer förhoppningsvis att göra det möjligt för läkemedelsföretag och forskare att bättre söka efter nya naturliga produkter som kan leda till utveckling av nya läkemedel."
Teamets arbete, "MolDiscovery:Att lära sig masspektrometrifragmentering av små molekyler, "publicerades nyligen i Naturkommunikation . I forskargruppen ingick Mohimani; CMU Ph.D. eleverna Liu Cao och Mustafa Guler; Yi-Yuan Lee, en forskningsassistent vid CMU; och Azat Tagirdzhanov och Alexey Gurevich, båda forskare vid Center for Algorithmic Biotechnology vid St. Petersburg State University.
Mohimani, vars forskning i Metabolomics and Metagenomics Lab fokuserar på sökandet efter nya, naturligt förekommande läkemedel, sagt efter att en vetenskapsman upptäckt en molekyl som lovar som ett potentiellt läkemedel i ett marin- eller jordprov, till exempel, det kan ta ett år eller längre att identifiera molekylen utan någon garanti för att ämnet är nytt. MolDiscovery använder masspektrometrimätningar och en prediktiv maskininlärningsmodell för att snabbt och exakt identifiera molekyler.
Masspektrometrimätningar är fingeravtrycken av molekyler, men till skillnad från fingeravtryck finns det ingen enorm databas att matcha dem mot. Även om hundratusentals naturligt förekommande molekyler har upptäckts, forskare har inte tillgång till sina masspektrometridata. MolDiscovery förutsäger identiteten för en molekyl från masspektrometridata utan att förlita sig på en masspektradatabas för att matcha den mot.
Teamet hoppas att MolDiscovery kommer att vara ett användbart verktyg för laboratorier i upptäckten av nya naturliga produkter. MolDiscovery skulle kunna arbeta tillsammans med NRPminer, en maskininlärningsplattform utvecklad av Mohimanis labb, som hjälper forskare att isolera naturprodukter. Forskning relaterad till NRPminer publicerades också nyligen i Naturkommunikation .