• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Kemi
    Den tid som behövs för att sekvensera nyckelmolekyler kan reduceras från år till minuter

    En programvara för nanopore och bildigenkänning kan sekvensera ett sulfaterat glykosaminoglykan i realtid. Kredit:Rensselaer Polytechnic Institute

    Med hjälp av en nanopore, forskare har visat möjligheten att minska tiden som krävs för sekvensering av ett glykosaminoglykan-en klass av långkedjelänkade sockermolekyler som är lika viktiga för vår biologi som DNA-från år till minuter.

    Som publicerades i veckan i Förfaranden från de nationella vetenskapsakademierna , ett team från Rensselaer Polytechnic Institute visade att programvara för maskininlärning och bildigenkänning kan användas för att snabbt och exakt identifiera sockerkedjor-specifikt fyra syntetiska heparansulfater - baserade på de elektriska signalerna som genereras när de passerade genom ett litet hål i en kristallplatta.

    "Glykosaminoglykaner är en komplex repertoar av sekvenser, som Shakespeares verk eller en dikt av Yates är en komplex boksamling. Det krävs en expert för att skriva dem och en expert för att läsa dem, "sade Robert Linhardt, ledande forskare och professor i kemi och kemisk biologi vid Rensselaer Polytechnic Institute. "Vi har tränat en maskin för att snabbt läsa motsvarigheten till ord med fyra bokstäver som" ababab "eller" bcbcbc. " Det här är enkla sekvenser som inte har någon betydelse, men de visar oss att maskinen kan läras läsa. Om vi ​​förlänger och utvecklar denna teknik, det har potential att sekvensera glykanerna eller till och med proteinerna i realtid, eliminera år av ansträngning. "

    Kommersiella nanoporesekvenseringsanordningar används för att sekvensera DNA, som består av fyra nukleinsyraenheter, känd med bokstäverna A, C, G, och t, ihop i en oändlig mängd olika konfigurationer. Enheten förlitar sig på en jonström som löper genom ett hål som bara är några miljarder meter brett i ett membran. Strängar av DNA placeras på ena sidan av hålet, och dras igenom med strömmen. Varje nukleinsyra blockerar hålet något när det passerar igenom, störa strömmen och ge en särskild signal associerad med den nukleinsyran. Enheterna, används för närvarande för fältarbete, är bara en av flera relativt snabba och automatiserade tekniker för sekvensering av DNA.

    Glykosaminoglykaner, eller GAG, är en strukturellt komplex klass av glykaner - de väsentliga sockerarter som finns i levande organismer - som finns på cellytorna och extracellulära matrisen hos alla djur och utför många funktioner vid celltillväxt och signalering, antikoagulation och sårreparation, och bibehålla celladhesion. GAG, utvinns för närvarande från slaktade djur, används som läkemedel och näringsläkemedel.

    Som DNA, GAG kan delas in i sina bestående disackaridsockerenheter. Men medan DNA består av endast fyra bokstäver i en linjär sträng, dessa glykaner har dussintals grundenheter, några med fästa sulfatgrupper, syragrupper, och amidgrupper. Till exempel, även en relativt liten naturligt förekommande heparansulfatmolekyl med sex sockerenheter kan ha 32, 768 möjliga sekvenser. På grund av utmaningen, glykansekvensering förblir betungande, förlitar sig på ett noggrant laboratoriearbete och sofistikerad analys, som involverar tekniker med namn som vätskekromatografi-tandem-masspektrometri och kärnmagnetisk resonansspektroskopi.

    Som en del av hans arbete, Linhardt, en glykansexpert som utvecklat en syntetisk variant av det vanliga blodförtunnande heparinet, sekvenser GAG för att förstå naturligt förekommande former och utveckla syntetiska varianter.

    "Med hjälp av vanliga analysmetoder, det tog oss två år att ordna den första enkla GAG, "sade Linhardt, medlem i Rensselaer Center för bioteknik och tvärvetenskapliga studier. "Vi har en till som vi har arbetat ut det mesta av sekvensen, och det har tagit oss fem plus år-och det kommer förmodligen att ta oss ytterligare fem år att slutföra det, "

    Motiverar att nanoporesekvensering kan användas för att identifiera disackaridenheterna i en GAG, forskargruppen byggde sin egen nanoporeenhet och syntetiserade fyra heparansulfat -GAG -kedjor med hjälp av den kemoenzymatiska processen som utvecklats av Linhardt Lab. Viktigt, dessa fyra heparansulfater var mycket enkla - gjorda med kombinationer av endast fyra olika typer av sockerenheter, monterad i en kedja som är cirka 40 enheter lång, och med en noggrant kontrollerad komposition och sekvens.

    Teamet passerade varje heparansulfat genom nanoporen och producerade en graf som visar spänning över tidens utmatning av enheten. Var och en av de fyra varianterna kördes genom enheten mer än 2, 000 gånger, öka den statistiska sannolikheten för en korrekt avläsning med tanke på den rudimentära utformningen av den experimentella nanoporen.

    "Enheten sekvenserade det enklaste heparansulfatet i realtid och producerade ett mönster som våra ögon lätt kunde känna igen direkt för vart och ett av de fyra proverna, "Sa Linhardt." Du kan genast se att de är olika. "

    För att säkerställa en opartisk analys, laget matade resultaten till gratis maskininlärning och bildigenkänningsprogramvara med hjälp av Googles djupa neurala nätverk, utbildning av programvaran för att skilja mellan de fyra olika mönstren och identifiera varje variant av heparansulfat. Den mest framgångsrika modellen för maskininlärning gav en analys som var nästan 97% korrekt.

    "Informationsinnehållet i en GAG -sekvens kan i hög grad överträffa innehållet i en liknande mängd DNA eller RNA, vilket betyder att förmågan att snabbt läsa GAG -sekvenser öppnar ett nytt fönster för förståelse för livets komplexa biokemi, säger Curt Breneman, dekanus vid Rensselaer vetenskapsskola. "Detta bevis på konceptstudie kopplar innovativa nanodetekteringsmetoder till toppmoderna maskininlärningsverktyg, och visar kraften i tvärvetenskapligt tänkande att utvidga kunskapsgränserna. "

    Att minska hastigheten med vilken GAG:erna passerar genom nanoporen kan öka noggrannheten, och enheten kan utbildas i ytterligare sockerenheter, och mer komplexa sekvenser, som alla är framtida forskningsmål. Linhardt sa att maskinen skulle behöva lära sig någonstans från 10 till 20 sockerenheter för att helt sekvensera en GAG.

    "Detta är ett bevis på konceptet; vi har fått det att läsa två bokstäver, "Sa Linhardt." När vi väl har lärt det hela alfabetet, det kommer att kunna läsa varje annan sekvens. Det kommer att kunna läsa alla ord. "


    © Vetenskap https://sv.scienceaq.com