• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Biologi
    Nytt ramverk för djupinlärning med flera uppgifter integrerar storskalig encellig proteomik och transkriptomikdata
    Integrering av covid-19 cellatlas. Kredit:Advanced Science (2024). DOI:10.1002/advs.202307835

    De exponentiella framstegen inom encellig multi-omics-teknik har lett till ackumuleringen av stora och olika multi-omics-dataset. Integrationen av encellig proteomik och transkriptomik (eller epigenomik) data utgör dock en betydande utmaning för befintliga metoder. Flera transformatorbaserade modeller, såsom Geneformer, har avsevärt förändrat paradigmet för encellstranskriptomanalys. Dessa metoder ställer dock betydande krav på beräkningsresurser.

    För att möta dessa utmaningar har forskare vid Wuhans botaniska trädgård vid den kinesiska vetenskapsakademin utvecklat en transformatorbaserad metod, kallad scmFormer, för att integrera storskalig encellig proteomik och transkriptomikdata med hjälp av en multi-task transformator. Studien med titeln "scmFormer Integrates Large‐Scale Single‐Cell Proteomics and Transcriptomics Data by Multi‐Task Transformer" publicerades i Advanced Science .

    Forskarna presenterade en omfattande utvärdering och gjorde fallstudier av denna metod, resultaten visade att scmFormer uppvisade anmärkningsvärd skicklighet i att harmonisera storskaliga encelliga omics plus proteomics datamängder på både celltyp och finskalig cellnivå med begränsade datorresurser.

    Dessutom har scmFormer förmågan att integrera flera encellsparade multimodala datamängder, vilket leder till den dubbla fördelen med minskade höga kostnader och förbättrade biologiska insikter.

    Dessutom visar scmFormer en enastående förmåga att eliminera tekniska skillnader mellan olika omics-modaliteter samtidigt som den underliggande biologiska informationen som är inneboende i data bevaras, som spänner över både celltyper och experimentella förhållanden.

    Tillämpningen av scmFormer för integrering av två COVID-19-datauppsättningar med 1,48 miljoner celler visade ytterligare den distinkta fördelen med scmFormer för att hantera stora datauppsättningar på vanliga bärbara datorer.

    Mer information: Jing Xu et al, scmFormer integrerar storskalig encellig proteomik och transkriptomikdata av Multi-Task Transformer, Advanced Science (2024). DOI:10.1002/advs.202307835

    Journalinformation: Avancerad vetenskap

    Tillhandahålls av Chinese Academy of Sciences




    © Vetenskap https://sv.scienceaq.com