Att blanda beräkningskemi och teoretisk matematik visade sig vara en vinnande formel för Emory-kemisten James Kindt (mitten), hans doktorander (från vänster) Xiaokun Zhang och Lara Patel, och matematikstudenterna Olivia Beckwith och Robert Schneider. Kredit:Stephen Nowland, Emory Foto/Video
Beräkningskemister och matematiker har utvecklat en ny, snabb metod för att beräkna jämviktskonstanter med småskaliga simuleringar – även när lagen om massverkan inte gäller.
Journal of Chemical Theory and Computation publicerade den resulterande algoritmen och programvaran, som forskarna har döpt till PEACH – en akronym för "partitionsaktiverad analys av klusterhistogram" och en nick till metodens utveckling i Georgia vid Emory University.
"Vår metod kommer att göra det möjligt för beräkningskemister att göra bättre förutsägelser i simuleringar för ett brett spektrum av komplexa reaktioner - från hur aerosoler bildas i atmosfären till hur proteiner går samman för att bilda amyloidfilament som är inblandade i Alzheimers sjukdom, säger James Kindt, en Emory-professor i beräkningskemi, vars labb ledde arbetet.
Tidigare skulle det krävas minst en veckas beräkningstid för att göra de beräkningar som behövs för sådana förutsägelser. PEACH-systemet minskar den tiden till sekunder genom att använda trick som härrör från talteorin.
"Vårt verktyg kan använda en liten uppsättning data och sedan extrapolera resultaten till ett stort systemfall för att förutsäga helheten, " säger Kindt.
"Det som gjorde det här projektet så roligt och intressant är de tvärkulturella aspekterna av det, " tillägger han. "Beräkningskemister och teoretiska matematiker använder olika språk och pratar inte ofta med varandra. Genom att arbeta tillsammans har vi råkat ut för något som verkar vara på gränsen för båda områdena."
I forskargruppen ingår Lara Patel och Xiaokun Zhang, som båda är Ph.D. studenter i kemi i Kindt-labbet, och talteoretiker Olivia Beckwith och Robert Schneider, Emory Ph.D. kandidater vid institutionen för matematik och datavetenskap. Chris Weeden, som Emory-student, bidragit till tidiga skeden av arbetet.
Jämviktskonstanten är ett grundläggande koncept som lärs ut i första året college kemi. Enligt lagen om massaktion, vid en given temperatur, oavsett hur mycket av en produkt och en reaktant som blandas ihop - så länge de är i jämvikt - kommer ett visst förhållande mellan produkt och reaktant att vara lika med jämviktskonstanten.
"Den ekvation gäller alltid i jämvikt för ett stort antal molekyler, " säger Kindt. "Det spelar ingen roll om det appliceras på en hink vatten eller på en enda droppe vatten - som består av ungefär en miljard biljoner molekyler."
I mycket mindre skalor av runt dussintals molekyler, dock, lagen om masshandling går sönder och gäller inte.
Kindt-labbet använder datorer för att simulera beteendet hos molekyler, i synnerhet hur de själva sätts ihop till kluster. Natriumoktylsulfat, eller SOS, är en av de föreningar som labbet använder som en experimentell modell. SOS är ett ytaktivt ämne som kan fungera som rengöringsmedel. Det bildar små kluster i vatten som kan kapsla in olja och fett. Simuleringar av hur SOS-molekyler kommer samman kan förutsäga fördelningen av storlekar av kluster som bildas under olika förhållanden, för att förbättra designen av tvålar och tvättmedel, och för att bättre förstå biologiska processer som hur gallsalter bryter ner kulor av fett under matsmältningsprocessen.
I ett nyckeltest av deras modell, labbet behövde för att säkerställa att jämvikten för sammansättningsreaktionen av SOS-molekyler till kluster stämde överens med experiment.
"Om vi skulle köra simuleringar med ett stort antal molekyler, vi kunde räkna klustren som bildades av varje storlek, räkna molekylerna som förblev fria från klustren, och använd denna information för att beräkna jämviktskonstanten för att bilda varje storlekskluster, " säger Kindt. "Utmaningen vi stod inför var att det skulle ta för lång tid för datorerna att utföra simuleringar av tillräckligt stort antal molekyler för att få detta att fungera, och för antalet klustrande molekyler vi praktiskt taget kunde hantera – runt 50 – skulle lagen om massverkan inte fungera."
Kindt bestämde sig för att närma sig problemet genom att överväga alla olika sätt som molekylerna i en reaktion kunde gruppera i kluster av olika storlekar för att komma fram till ett genomsnitt. Efter att ha läst lite, han insåg att dessa olika sätt att gruppera molekyler var det som talteoretiker kallar heltalspartitioner.
En partition av ett tal är en sekvens av positiva heltal som summeras till det talet. Till exempel, det finns fem partitioner av talet 4 (4 =3+1 =2+2 =2+1+1 =1+1+1+1). Partitionsnumren växer i en otrolig hastighet. Antalet partitioner för nummer 10 är 42. För nummer 100, partitionerna exploderar till mer än 190, 000, 000.
Samma explosion av möjligheter inträffar för hur molekyler kan klustras.
Lara Patel och Xiaokun Zhang arbetade på en "brute force"-metod för att få en dator att gå igenom varje enskilt sätt att kombinera 10 molekyler av en typ med 10 molekyler av en annan typ. Problemet var att det tog en dator som arbetade ett par dagar att göra en enda analys. Och beräkningstiden som behövs om bara några fler molekyler lades till i analysen ökade exponentiellt.
Beräkningskemisterna hade träffat en vägg.
Kindt nådde Ken Ono, en världsberömd talteoretiker vid Emorys matematik- och datavetenskapsavdelning, för att se om någon av hans doktorander skulle vara intresserad av att ta tag i problemet.
Olivia Beckwith och Robert Schneider slog till.
"Kindt-labbets datorsimuleringar visar att klassiska teorem från partitionsteorin faktiskt förekommer i naturen, även för små antal molekyler, "Säger Schneider. "Det var överraskande och kändes väldigt kosmiskt för mig att lära mig att sifferteorin avgör händelser i den verkliga världen."
"Det var definitivt oväntat, ", tillägger Beckwith. "I teoretisk matematik tenderar vi att arbeta isolerat från fysiska fenomen som interaktionen mellan molekyler."
Kemisterna och matematikerna började träffas regelbundet för att diskutera problemet och lära sig varandras terminologi. "Jag var tvungen att ta fram min sons kemibok på gymnasiet och tillbringa en helg med att läsa igenom den, " säger Schneider.
"Det hände så organiskt, " Patel säger om processen att blanda sina två specialiteter. "Olivia och Robert skrev ekvationer på tavlan och så fort en formel var vettig för mig började jag tänka i mitt huvud, "Hur kan vi koda detta så att vi kan tillämpa det?"
De två matematikerna föreslog en strategi som kunde göra problemet mycket lättare att beräkna, baserad på ett teorem som kallas Faà di Brunos formel.
"Det var förvånande, " säger Zhang, "eftersom det var en idé som aldrig skulle ha fallit mig in. De hjälpte oss att lossna och hitta ett sätt att driva vår forskning framåt."
"De hjälpte oss att hitta en genväg så att vi inte behövde generera alla partitioner för hur molekylerna kunde klumpa ihop sig, Kindt tillägger. "Deras algoritm är ett mycket mer elegant och enkelt sätt att hitta hela genomsnittet överlag."
Patel och Zhang använde denna nya algoritm för att sätta ihop en mjukvara för att analysera data från datorsimuleringarna. Det resulterande systemet, PERSIKA, snabbar upp beräkningar som tidigare tog två timmar till bara en sekund. Efter att ha demonstrerat hur PEACH förenklar simuleringar av SOS-sammansättningar, forskargruppen går vidare med att simulera denna process för en rad andra molekyler.
"Vi är intresserade av att beskriva hur molekylära strukturer dikterar montering i alla typer av scenario, såsom de tidiga stadierna av kristallbildning, " säger Kindt. "Vi arbetar också med att kvantifiera precis var lagen om masshandling går sönder. Vi skulle då kunna förfina PEACH-strategin för att göra den ännu mer effektiv."