Forskare som arbetar inom organisk kemi skapar och studerar nya molekyler med magnetisk resonans. Standarderna som används för att transkribera de insamlade uppgifterna är, dock, specifika för varje laboratorium eller publikation, gör det svårt att exportera informationen elektroniskt och därmed användas av forskarvärlden. Ett internationellt team som leds av kemister från universitetet i Genève (UNIGE) har utvecklat ett nytt gemensamt elektroniskt språk som översätter data från varje molekyl på exakt samma sätt och gör det enkelt att exportera dem från ett informationssystem till ett annat. Detta innebär att kemister överallt enkelt kan komma åt direkt återanvändbar data, vilket ger betydande tidsbesparingar för framtida forskning. Den här studien, publiceras i tidskriften Magnetisk resonans i kemi , banar väg för att skapa en internationell, öppen databas och specifika verktyg, inklusive analys av artificiell intelligens.
Organiska kemister skapar nya molekyler baserade på kolatomer; dessa är så små, dock, att det är omöjligt att se vad de syntetiserar. Forskare använder magnetisk resonans för att verifiera dessa sammansättningar som är gjorda "blinda":Varje atom som utgör molekylen avger en signal, vars frekvens översätts i form av ett spektrum som kemisterna sedan kan avkoda. För att bestämma strukturen av en molekyl, forskare måste kunna "läsa" de magnetiska resonansspektra.
Kemister har ett specifikt ordförråd för att beskriva spektra och detaljera atomernas resonans. Men hur rådata översätts till ett skriftspråk varierar beroende på det enskilda laboratoriet, programvaran som används och den specifika publikationen. Kortfattat, det finns ingen tillgänglig databas för tilldelade molekylära strukturer eller någon enhetlighet i hur spektra bearbetas och de data som tillskrivs dem. "Det är därför det är väldigt svårt att återanvända data som genererats av andra laboratorier, " förklarar Damien Jeannerat, en forskare vid institutionen för organisk kemi vid UNIGE:s naturvetenskapliga fakultet. "Så vi kom på idén att ta fram ett enda elektroniskt språk som kan användas för att byta från ett system till ett annat utan att förlora någon precision, och att bygga en internationell, databas med öppen åtkomst. "
UNIGE-kemisterna slog sig ihop med fältspecialister och introducerade ett nytt elektroniskt språk som kan fungera som standard för bearbetning av organiska molekyldata. "Vårt nya format, kallad NMReDATA, fungerar enligt ett system av etiketter som tilldelas varje dataelement som extraheras från spektra i en definierad ordning, och som lätt kan läsas av en dator, "säger Marion Pupier, en kemiingenjör vid institutionen för organisk kemi vid UNIGE. Frekvensen för varje atom kommer att beskrivas i en sekvens som visar det kemiska skiftet, antalet atomer, kopplingarna, de interatomiska korrelationerna och slutligen uppgifterna. "Tills nu, alla har använt sin egen sekvens för att överföra samma information, omöjliggör elektronisk överföring från en dator till en annan och tvingar forskarna att övervaka och ständigt omorganisera informationen. Men det kommer inte att behövas göra detta med vårt system, tack vare språkets enhetliga karaktär, säger Damien Jeannerat.
Tanken på ett gemensamt elektroniskt språk är nära kopplat till viljan att skapa öppna databaser. "Detta skulle göra det möjligt för kemister att hitta den exakta sammansättningen av molekylerna de studerar utan att behöva göra om det arbete som redan har gjorts tidigare, "säger Marion Pupier. Informationen kommer att vara synlig och tillgänglig var som helst och när som helst, sparar avsevärd tid och pengar för forskning om organisk kemi.
Nu återstår bara att sprida det nya formatet och etablera det som norm för publicering av artiklar i de stora internationella tidskrifterna. "Vi hoppas att all mjukvara kommer att vara i full drift om cirka ett år, och att NMReDATA kommer att användas av alla, säger Jeannerat avslutningsvis.