• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Djupt lärande-drivet DeepEC-ramverk hjälper till att korrekt förstå enzymfunktioner

    Övergripande schema för DeepEC. Kredit:KAIST

    En djup inlärningsdriven beräkningsram, 'DeepEC, ' kommer att möjliggöra högkvalitativ och hög genomströmning förutsägelse av enzymkommissionsnummer, vilket är väsentligt för en korrekt förståelse av enzymfunktioner.

    Ett team bestående av Dr Jae Yong Ryu, Professor Hyun Uk Kim, och framstående professor Sang Yup Lee vid KAIST rapporterade beräkningsramverket som drivs av djupinlärning som förutsäger enzymkommissionsnummer (EC) med hög precision på ett sätt med hög genomströmning.

    DeepEC tar en proteinsekvens som indata och förutsäger exakt EC-nummer som en utdata. Enzymer är proteiner som katalyserar biokemiska reaktioner och EG-nummer, som består av fyra nivånummer (dvs. a, b, c, d) indikerar biokemiska reaktioner. Således, identifieringen av EG-nummer är avgörande för att korrekt förstå enzymfunktioner och metabolism.

    EC-nummer ges vanligtvis till en proteinsekvens som kodar för ett enzym under ett genomannoteringsförfarande. På grund av vikten av EG-nummer, flera verktyg för att förutsäga EC-nummer har utvecklats, men de har utrymme för ytterligare förbättringar med avseende på beräkningstid, precision, rapportering, och den totala storleken på filerna som behövs för EG-nummerförutsägelsen.

    DeepEC använder tre konvolutionella neurala nätverk (CNN) som en viktig motor för att förutsäga EC-nummer, och implementerar även homologianalys för EC-nummer om de tre CNN:erna inte producerar tillförlitliga EC-nummer för en given proteinsekvens. DeepEC utvecklades med hjälp av en guldstandarddatauppsättning som täcker 1, 388, 606 proteinsekvenser och 4, 669 EG-nummer.

    Särskilt, benchmarkingstudier av DeepEC och fem andra representativa verktyg för att förutsäga EC-nummer visade att DeepEC gjorde de mest exakta och snabbaste förutsägelserna för EC-nummer. DeepEC krävde också det minsta diskutrymmet för implementering, vilket gör det till en idealisk programvarukomponent från tredje part.

    Vidare, DeepEC var den mest känsliga för att detektera enzymatisk funktionsförlust som ett resultat av mutationer i domäner/bindningsställesrester av proteinsekvenser; i denna jämförande analys, alla domäner eller rester av bindningsställe ersattes med L-alaninrester för att ta bort proteinfunktionen, som är känd som L-alanin-skanningsmetoden.

    Denna studie publicerades online i Proceedings of the National Academy of Sciences ( PNAS ) den 20 juni, 2019, med titeln "Djup inlärning möjliggör förutsägelse av enzymkommissioner av hög kvalitet och hög genomströmning."

    "DeepEC kan användas som ett oberoende verktyg och även som en tredje parts mjukvarukomponent i kombination med andra beräkningsplattformar som undersöker metabola reaktioner. DeepEC är fritt tillgängligt online, sa professor Kim.

    Den framstående professor Lee sa, "Med DeepEC, det har blivit möjligt att bearbeta ständigt ökande volymer av proteinsekvensdata mer effektivt och mer exakt."


    © Vetenskap https://sv.scienceaq.com