Långa icke-kodande RNA (lncRNA) är allestädes närvarande transkript med avgörande regulatoriska roller i olika biologiska processer, inklusive kromatinremodellering, post-transkriptionell reglering och epigenetiska modifieringar. Även om ackumulerande bevis klarlägger mekanismer genom vilka växt-lncRNA modulerar tillväxt, rotutveckling och frövila, är deras exakta identifiering fortfarande utmanande på grund av bristen på växtspecifika metoder.
För närvarande är de vanliga metoderna för växt-lncRNA-identifiering till stor del utvecklade baserat på datauppsättningar från människor eller djur. Följaktligen har noggrannheten och effektiviteten av dessa metoder för att förutsäga växt-lncRNA inte utvärderats helt.
Nyligen publicerades en forskningsartikel med titeln "Plant-LncPipe:a computational pipeline providing significant improvement in plant lncRNA identification" av en grupp ledd av Jian-Feng Mao från Beijing Forestry University och Umeå University i Horticulture Research .
Denna studie samlade i stor utsträckning högkvalitativa RNA-sekvenseringsdata från olika växter och använde dessa växtspecifika data för att träna om modellerna av tre vanliga lncRNA-förutsägelseverktyg, nämligen CPAT, LncFinder och PLEK. Prestandan för de omtränade modellerna jämfördes och utvärderades mot andra populära lncRNA-förutsägelseverktyg, såsom CPC2, CNCI, RNAplonc och LncADeep.
Resultaten visade att de omtränade modellerna signifikant förbättrade prediktionsprestandan för växt-lncRNA. Bland dem överträffade två omskolade modeller, LncFinder-plant och CPAT-plant, andra på flera utvärderingsmått, vilket gjorde dem till de mest lämpliga verktygen för växt-lncRNA-identifiering.
Denna forskning utvecklade en beräkningspipeline vid namn Plant-LncPipe för identifiering och analys av växt-lncRNA.
Denna pipeline integrerar två topppresterande identifieringsmodeller, CPAT-plant och LncFinder-plant, vilket möjliggör en omfattande beräkningsprocess som omfattar förbearbetning av rådata, transkriptmontering, lncRNA-identifiering, lncRNA-klassificering och lncRNA-ursprung. Denna beräkningspipeline kan användas i stor utsträckning på olika växtarter. Plant-LncPipe är allmänt tillgänglig.
Studien visar att omträning av lncRNA-förutsägelsemodeller på högkvalitativa växttranskriptomiska data möjliggjorde mer exakt infångning av växt-lncRNA-funktioner, vilket avsevärt förbättrade förutsägelseprecisionen och tillförlitligheten. Studien underströk vikten av artspecifik omskolning för att förbättra modellens noggrannhet. Omskolning av befintliga mogna modeller bibehöll tidigare ackumulerad erfarenhet och metoder samtidigt som modellens tillämpbarhet och noggrannhet ökade ytterligare.
Mer information: Xue-Chan Tian et al, Plant-LncPipe:en beräkningspipeline som ger betydande förbättringar i växt-lncRNA-identifiering, Trädgårdsforskning (2024). DOI:10.1093/hr/uhae041
Journalinformation: Trgårdsbruksforskning
Tillhandahålls av Chinese Academy of Sciences