Kredit:CC0 Public Domain
Tandemmasspektrometri är ett kraftfullt analysverktyg som används för att karakterisera komplexa blandningar inom läkemedelsupptäckt och andra områden.
Nu, Purdue Universitys innovatörer har skapat en ny metod för att tillämpa maskininlärningskoncept på tandemmasspektrometriprocessen för att förbättra informationsflödet vid utvecklingen av nya läkemedel. Deras arbete publiceras i Kemivetenskap .
"Masspektrometri spelar en viktig roll i läkemedelsupptäckt och utveckling, " sa Gaurav Chopra, en biträdande professor i analytisk och fysikalisk kemi vid Purdue's College of Science. "Den specifika implementeringen av bootstrapped maskininlärning med en liten mängd positiva och negativa träningsdata som presenteras här kommer att bana väg för att bli mainstream i dagliga aktiviteter för att automatisera karaktärisering av föreningar av kemister."
Chopra sa att det finns två stora problem inom området maskininlärning som används för kemiska vetenskaper. Metoder som används ger inte kemisk förståelse för de beslut som fattas av algoritmen, och nya metoder används vanligtvis inte för att göra blinda experimentella tester för att se om de föreslagna modellerna är korrekta för användning i ett kemiskt laboratorium.
"Vi har tagit upp båda dessa punkter för en metod som är isomerselektiv och extremt användbar inom kemivetenskap för att karakterisera komplexa blandningar, identifiera kemiska reaktioner och läkemedelsmetaboliter, och inom områden som proteomik och metabolomik, " sa Chopra.
Purdue-forskarna skapade statistiskt robusta maskininlärningsmodeller för att arbeta med mindre träningsdata – en teknik som kommer att vara användbar för läkemedelsupptäckt. Modellen tittar på ett vanligt neutralt reagens – kallat 2-metoxipropen (MOP) – och förutsäger hur föreningar kommer att interagera med MOP i en tandemmasspektrometer för att få strukturell information för föreningarna.
"Detta är första gången som maskininlärning har kopplats till diagnostiska gasfas-jon-molekylreaktioner, och det är en mycket kraftfull kombination, leder vägen till helt automatiserad masspektrometrisk identifiering av organiska föreningar, sa Hilkka Kentämaa, Frank Browns framstående professor i analytisk kemi och organisk kemi. "Vi introducerar nu många nya reagenser i denna metod."
Purdue-teamet introducerar flödesscheman för kemisk reaktivitet för att underlätta kemisk tolkning av de beslut som fattas av maskininlärningsmetoden som kommer att vara användbara för att förstå och tolka massspektra för strukturell information.