• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Biologi
    Ett nytt verktyg för växt lång icke-kodande RNA-identifiering
    ROC-kurvor för de omtränade och ursprungliga modellerna på datauppsättningar från 20 växtarter. En ROC-kurvor av den omtränade CPAT-växtmodellen och dess jämförelse med de ursprungliga modellerna för människa och mus. B ROC-kurvor för den omtränade LncFinder-växtmodellen och jämförelse med originalmodellerna för människa, mus och vete. C ROC-kurvor för den omtränade PLEK-växtmodellen och dess jämförelse med den ursprungliga modellen för människa. Kredit:Trädgårdsforskning (2024). DOI:10.1093/hr/uhae041

    Långa icke-kodande RNA (lncRNA) är allestädes närvarande transkript med avgörande regulatoriska roller i olika biologiska processer, inklusive kromatinremodellering, post-transkriptionell reglering och epigenetiska modifieringar. Även om ackumulerande bevis klarlägger mekanismer genom vilka växt-lncRNA modulerar tillväxt, rotutveckling och frövila, är deras exakta identifiering fortfarande utmanande på grund av bristen på växtspecifika metoder.



    För närvarande är de vanliga metoderna för växt-lncRNA-identifiering till stor del utvecklade baserat på datauppsättningar från människor eller djur. Följaktligen har noggrannheten och effektiviteten av dessa metoder för att förutsäga växt-lncRNA inte utvärderats helt.

    Nyligen publicerades en forskningsartikel med titeln "Plant-LncPipe:a computational pipeline providing significant improvement in plant lncRNA identification" av en grupp ledd av Jian-Feng Mao från Beijing Forestry University och Umeå University i Horticulture Research .

    Denna studie samlade i stor utsträckning högkvalitativa RNA-sekvenseringsdata från olika växter och använde dessa växtspecifika data för att träna om modellerna av tre vanliga lncRNA-förutsägelseverktyg, nämligen CPAT, LncFinder och PLEK. Prestandan för de omtränade modellerna jämfördes och utvärderades mot andra populära lncRNA-förutsägelseverktyg, såsom CPC2, CNCI, RNAplonc och LncADeep.

    Resultaten visade att de omtränade modellerna signifikant förbättrade prediktionsprestandan för växt-lncRNA. Bland dem överträffade två omskolade modeller, LncFinder-plant och CPAT-plant, andra på flera utvärderingsmått, vilket gjorde dem till de mest lämpliga verktygen för växt-lncRNA-identifiering.

    Denna forskning utvecklade en beräkningspipeline vid namn Plant-LncPipe för identifiering och analys av växt-lncRNA.

    Denna pipeline integrerar två topppresterande identifieringsmodeller, CPAT-plant och LncFinder-plant, vilket möjliggör en omfattande beräkningsprocess som omfattar förbearbetning av rådata, transkriptmontering, lncRNA-identifiering, lncRNA-klassificering och lncRNA-ursprung. Denna beräkningspipeline kan användas i stor utsträckning på olika växtarter. Plant-LncPipe är allmänt tillgänglig.

    Studien visar att omträning av lncRNA-förutsägelsemodeller på högkvalitativa växttranskriptomiska data möjliggjorde mer exakt infångning av växt-lncRNA-funktioner, vilket avsevärt förbättrade förutsägelseprecisionen och tillförlitligheten. Studien underströk vikten av artspecifik omskolning för att förbättra modellens noggrannhet. Omskolning av befintliga mogna modeller bibehöll tidigare ackumulerad erfarenhet och metoder samtidigt som modellens tillämpbarhet och noggrannhet ökade ytterligare.

    Mer information: Xue-Chan Tian et al, Plant-LncPipe:en beräkningspipeline som ger betydande förbättringar i växt-lncRNA-identifiering, Trädgårdsforskning (2024). DOI:10.1093/hr/uhae041

    Journalinformation: Trgårdsbruksforskning

    Tillhandahålls av Chinese Academy of Sciences




    © Vetenskap https://sv.scienceaq.com