Retrosyntes syftar till att förutsäga en uppsättning reaktanter för att producera givna molekyler, vilket spelar en betydande roll inom biokemiområdet, såsom design av molekylära vägar och läkemedelsupptäckt. De flesta befintliga metoder drar bara nytta av en typ av information snarare än att ytterligare beakta de olika aspekterna av molekylär information.
För att ta itu med denna fråga genomförde en forskargrupp en studie, nu publicerad i Frontiers of Computer Science .
Teamet föreslog ett multiströmsnätverk för förutsägelse av retrosyntes genom att beskriva molekyler från flera perspektiv med hjälp av deras SMILES och ECFP-deskriptorer.
MSNR består av tre huvudmoduler:(i) Den parallella CNN och text-CNN som tar ECFPs och SMILES efter one-hot-kodning som indata för att producera de djupa funktionerna. (ii) Kombinationsrepresentationen skapas genom att sammansmälta de två typerna av djupa drag hos ECFPs och SMILES, som ger ett djupgående perspektiv på molekylär representation. (iii) Tre täta klassificerare har implementerats för att förutsäga sannolikheten för reaktanter för molekyler, vilket utnyttjar de djupa egenskaperna som extraheras av olika strömmar som den molekylära representationen, respektive.
Genom att sammansmälta dessa multiströmsförutsägelseresultat med varierande vikter kommer modellen fram till en slutlig retrosyntesförutsägelse. Dessutom tränas modellen med en övergripande förlustfunktion som kan utnyttja den mångsidiga information som finns tillgänglig från varje typ av djupa funktioner.
Mer information: Qiang Zhang et al, A multi-stream network for retrosynthesis prediction, Frontiers of Computer Science (2023). DOI:10.1007/s11704-023-3103-z
Tillhandahålls av Frontiers Journals