• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Biologi
    AI förväntas avslöja hemligheterna för icke-kodande gener
    Kredit:Pixabay/CC0 Public Domain

    Från smarta chatbots till appar som kan skriva hela artiklar, artificiell intelligens (AI) blir en allt mer allmänt förekommande del av våra liv. Michael Schon, en forskarassistent vid Wageningen University &Research, designar ett AI-verktyg som kan utföra jämförelser av icke-kodande RNA på växtgenom. Verktyget förväntas påskynda och förenkla den framtida utvecklingen av nya växtsorter med större motståndskraft mot exempelvis torka eller sjukdomar.



    Proteiner är byggstenarna för celler i organismer. Instruktionerna för att göra dessa proteiner utfärdas (kodas) av RNA från gener. Vid sidan av dessa kodande RNA kan vissa gener producera icke-kodande RNA:med andra ord, RNA som inte innehåller instruktioner för att göra ett protein.

    Den här typen av RNA spelar också en viktig roll i utvecklingen av organismer, säger Michael Schon. "De kan till exempel aktivera gener, eller göra tvärtom och stänga av dem. Detta kommer att påverka utseendet på en växt och de egenskaper den har. Vissa viktiga icke-kodande RNA avgör också om en växt överhuvudtaget når mognad."

    Släktingar inom samma familj

    Icke-kodande RNA kan också potentiellt avslöja varför en växtart tillhör en viss familj men ändå har olika egenskaper. I tidigare forskning har Schon identifierat icke-kodande RNA från Arabidopsis thaliana (talkrasse). Denna växt används av växtforskare som en modellorganism.

    "Arabidopsis tillhör familjen Brassicaceae, tillsammans med viktiga grödor som broccoli, blomkål och kålrabbi. Denna familj är också känd som senaps- eller crucifer-familjen. Det är dock svårt att jämföra icke-kodande RNA från Arabidopsis med andra växter i senapsfamiljen eftersom tidigare arbete med dessa arter har fokuserat huvudsakligen på proteinkodande gener."

    Begränsad annotering av icke-kodande RNA

    Detta innebär att en jämförelse mellan växter kräver separat genanteckning för det icke-kodande RNA:t för varje gröda. Genom sitt Veni-projekt letar Schon efter nya sätt att identifiera icke-kodande RNA genom att använda kunskap från besläktade arter.

    "Mer än 200 genomsekvenser är tillgängliga för växter inom senapsfamiljen. Varje genom lagras som en stor textfil bestående av miljontals bokstäver som representerar baserna i en DNA-molekyl (A, C, T och G). Eftersom icke -Kodande bitar är inte korrekt katalogiserade (kommenterade) i dessa genom, det är omöjligt att jämföra alla icke-kodande gener som är utspridda i detta berg av data. Vi behöver nya strategier och verktyg för det, jag försöker utveckla dem.

    En liten del av varje genom

    Det första problemet är att veta var i genomet man ska leta. Ett av verktygen Schon utvecklar är något han kallar GeneSketch. För att hitta motsvarande delar av olika genom använder han en metod som kallas Minimizer Sketch.

    "Tanken bakom Minimizer Sketch är att du bara behöver titta på en liten bit av DNA - en skiss - snarare än hela sekvensen", säger Schon. "Det betyder att du bara behöver vara uppmärksam på några tusen tecken per genom för att göra en jämförelse, snarare än miljoner.

    Minimizer Sketch användes tidigare för att bygga ett träd av primatutveckling, som inkluderar människor och deras närmaste släktingar. Det visade sig att ett mycket exakt släktträd av våra förfäder kan göras från skisser gjorda av mindre än 1% av hela genomen. En minimeringsskiss är därför ett mycket effektivt sätt att uppskatta hur lika bitar av DNA är varandra, så den borde också vara användbar för att jämföra genom inom senapsfamiljen."

    Samma teknik som ChatGPT

    När du vet var du ska leta är nästa steg att förstå vad du tittar på. Tekniken Schon planerar att använda i GeneSketch är densamma som den som för närvarande används i andra AI-verktyg, som ChatGPT.

    "Det är något som kallas "transformatorteknik", säger Schon.

    "Du kan be en transformator att fylla i ett saknat ord i en mening till exempel. Inledningsvis ger transformatorn dig ett slumpmässigt ord eftersom den aldrig har sett ord förut. Men om du tränar den på miljontals exempelmeningar lär den sig långsamt att gissa rätt ord genom att vara uppmärksam på mönster i texten.

    "Efter träning blir en stor språkmodell som ChatGPT väldigt bra på vissa uppgifter, som att svara på frågor eller översätta från ett språk till ett annat. En transformator kan tränas för att lära sig inte bara mänskliga språk, utan också språket DNA, som har sitt egna distinkta mönster Jag arbetar på en modell för att upptäcka mönster i DNA från många olika arter, och översätta dessa mönster till ett språk som vi som människor kan förstå."

    Modellen måste tränas

    Schon kommer att träna transformatorn för GeneSketch för att uppmärksamma hur gener förändras mellan olika arter, särskilt icke-kodande gener. Men han räknar med att stöta på några utmaningar på vägen.

    "En viktig fråga är tillförlitlighet. Transformatorn är en relativt ny teknik, och den gör misstag. ChatGPT, till exempel, tränades på många olika textkällor, men om du frågar den ett ämne som den aldrig såg under träningen, måste den hitta på något Du hoppas att det gör upp något rimligt baserat på de mönster som det har sett, men det är uppenbart att du vill undvika nonsens-output kan kosta mycket tid och pengar. Är det bättre att träna modellen helt från grunden eller bygga av befintliga modeller."

    Potential för GeneSketch

    Schon hoppas kunna ha en prototyp av GeneSketch efter projektets första år, som startade i oktober 2023. Han planerar att använda den för att skapa genkommentarer för hela senapsfamiljen.

    Verktyget kan vara användbart inte bara för forskningssektorn utan också för jordbruksindustrin, säger Schon. "Det skulle till exempel kunna ge fröuppfödare ett snabbt sätt att förstå DNA från en gröda och dess vilda släktingar. Genom att lära sig mer om hur grödor har kunnat utveckla unika egenskaper under århundradena kan uppfödare fatta mer välgrundade beslut för förbättra egenskaper, som att göra grödor mer motståndskraftiga mot klimatförändringar, så den potentiella effekten kan bli enorm."

    Tillhandahålls av Wageningen University




    © Vetenskap https://sv.scienceaq.com