Forskare har använt Diamond Light Source för att utveckla en ny metod för att extrahera tidigare dold information från röntgendiffraktionsdata som mäts vid upplösning av de tredimensionella (3D) atomstrukturerna för proteiner och andra biologiska molekyler.
När man försöker utveckla kemiska föreningar mot potenta läkemedelskandidater, forskare försöker studera atomdetaljerna om hur föreningar binder till sina målproteiner. Att göra så, de jämför röntgendata mätt i både närvaro och frånvaro av föreningen. Dock, med befintliga analysalgoritmer, denna skillnadssignal kan ofta överbelastas av brus från experimentartefakter, vilket gör det mycket opålitligt att tolka den observerade signalen.
Den nya Pan-Dataset Density Analysis (PanDDA) -metoden extraherar bilden av den bundna föreningen i exceptionellt tydliga och entydiga detaljer. PanDDA identifierar först källan till bruset, och tar sedan bort det från data. Det utnyttjar Diamonds förmåga att snabbt upprepa dussintals till hundratals mätningar, som sedan kännetecknas av skillnader mellan dem, indikerar närvaron av bunden förening, varefter en bruskorrigering tillämpas i 3D. Resultaten publiceras idag i Naturkommunikation .
Makromolekylär kristallografi (MX), tekniken som PanDDA tillämpar, är ett av de mest kraftfulla verktygen som används av forskare som är intresserade av att bestämma 3D -strukturer för stora biologiska molekyler, inklusive proteiner, och är arbetshästsexperimentet för rationell läkemedelsdesign.
"Problemet med att identifiera bindande händelser i kristallografiska datamängder kan kännas som att leta efter en nål i en höstack, "förklarar Dr Nicholas Pearce, huvudförfattare på uppsatsen som kommer från hans doktorandprojekt vid University of Oxford i Systems Approaches for Biomedical Science (SABS) Center for Doctoral Training, där han finansierades gemensamt av UCB Pharma och Diamond. "När det gäller data vi analyserade, det var ännu värre, eftersom vi hade hundratals höstackar, och visste inte vilken av dem som innehöll nålar. "Nick är nu baserat i Crystal &Structural Chemistry Group vid Universiteit Utrecht.
Forskarna kunde till sin fördel använda det faktum att de flesta mätningarna var från 'tomma' kristaller som inte innehöll en bunden ligand, så att de kan karakterisera den obundna formen och helt enkelt leta efter datauppsättningar som var annorlunda.
"I kristallografi kan du ofta sakna" svaga "bundna former, eftersom varje mätning är en superposition av de bundna och obundna formerna, "fortsätter Dr Pearce." Det här liknar flera ark spårpapper, var och en med minst två bilder, alla överlagrade ovanpå varandra. "
"När du försöker identifiera bilden på bara ett av" arken ", det blir förvirrat av vad som visar sig från alla andra blad, så bilden blir känslig för tolkningsfel, "Dr Pearce tillägger." För att övervinna detta, vi utvecklade en metod för att extrahera rätt uppsättning "ark" från superpositionen; när vi väl hade gjort det, det blir mycket lättare att tolka den bundna formen, och gör att vi kan tolka uppgifterna med säkerhet, och bygga modeller av de intressanta tillstånden i data. "
"Grundidén är konceptuellt mycket enkel, nämligen att behandla den förvirrande superpositionen som ett bakgrundskorrigeringsproblem, "förklarar professor Frank von Delft, som tillsammans är huvudutredare för gruppen Proteinkristallografi i Structural Genomics Consortium (SGC) vid University of Oxford, och Principal Beamline Scientist från I04-1 beamline vid Diamond. "Dock, en exakt uppskattning av bakgrunden är avgörande, och i praktiken var detta otänkbart fram till tillkomsten av den nya robottekniken som erbjuds av Diamond, vilket gör det rutinmässigt att göra så många mätningar. "
"UCB är mycket glada över att ha arbetat nära Diamond med utvecklingen av PanDDA och dess tillämpning på kristallografisk fragment screening, "kommenterar Dr Neil Weir, Senior Vice President of Discovery på UCB Pharma. "Som ett direkt resultat, vi har kunnat identifiera fragment, som annars inte kunde skiljas från bakgrunden, bunden till ett viktigt protein-protein-interaktionsläkemedelsmål. "
Forskningen involverade att producera cirka 860 datamängder, varav endast 75 innehåller en bunden form av intresse för forskarna. "Även om det är allmänt tillämpligt i MX, metoden är särskilt transformativ för en version av MX -experimentet kallad fragment screening, där effekterna vi letar efter är mycket sällsynta och ännu svårare att verifiera med konventionella algoritmer, "fortsätter von Delft.
En avgörande kod för arbetet var uppladdning av alla strukturer till Protein Data Bank (wwPDB), online -arkivet för 3D -strukturer av proteiner och nukleinsyror, där alla har helt fri tillgång till alla strukturer som någonsin publicerats. En av wwPDB -värdsajterna, RCSB PDB, nyligen utvecklat ett nytt gruppavsättningsverktyg för att tillåta massöverföring av strukturer, och detta var avgörande för att slutföra detta samarbete.
The RCSB PDB Group Deposition system allows authors to take advantage of local templates and PDB_extract for batch processing, packing, upload, review, validation, and one-click submission of many structures at once. Searching group title "PanDDA analysis group deposition" at rcsb.org will return these 860 depositions.
"The Diamond and PDB groups have accomplished something quite incredible, and we have been delighted to help them" says Aled Edwards, Director of the SGC. "I would also like to highlight the team's commitment to open science. By placing all the research output into the public domain, they have ensured that the data can be used by all."
Now celebrating its 10th year of research and innovation, Diamond is committed to working with our users to enable them to carry out world-leading research at the facility.
"We've come a long way in the last ten years, and collaborations like these are key to how we will maintain our place as a key facility for researchers working in the life sciences, " adds Professor Dave Stuart, Director of Life Sciences at Diamond. "The idea that we can clearly see weak binding events is particularly exciting and something we're looking forward to sharing with our crystallography community."
The researchers hope that this new method will provide a significant shift in how crystallographic models are generated; opening windows to explore more poorly ordered crystals.