Grundläggande arkitektur för inlärningsförfarandet i random forest-metoden. Kredit:SIOM
Maskininlärning är en viktig gren inom artificiell intelligens. Dess grundidé är att bygga en statistisk modell baserad på data och använda modellen för att analysera och förutsäga data. Med den snabba utvecklingen av big data-teknik, datadrivna maskininlärningsalgoritmer har börjat blomstra inom olika områden av materialforskning.
Nyligen, ett forskarlag ledd av prof. Wang Jun från Shanghai Institute of Optics and Fine Mechanics vid den kinesiska vetenskapsakademin (CAS) föreslog en igenkänningsmetod för att särskilja monolagers kontinuerliga film och slumpmässiga defektområden i tvådimensionell (2-D) halvledare som använder maskininlärningsmetoden med Raman-signaler.
Deras arbete avslöjade tillämpningspotentialen för maskininlärningsalgoritmer inom området 2D-materialspektroskopi, och publicerades i Nanomaterials.
Raman-spektrumet av 2D-material är mycket känsligt för molekylär bindning och provstruktur, och kan användas för forskning och analys av kemisk identifiering, morfologi och fas, internt tryck/stress, och sammansättning. Även om Raman-spektroskopi ger tillräckligt med information, hur man kan bryta djupet av information och använda multipel information för att fatta omfattande beslut behöver fortfarande forskning.
I den här studien, forskarna använde olika funktionsinformation inklusive Raman-frekvensen och intensiteten för MoS2. De använde bootstrap-samplingsprocessen för att få delträningsuppsättningar som innehöll olika rumslig platsinformation, och etablerade en slumpmässig skogsmodell sammansatt av ett visst antal beslut genom inlärningsförfarandet.
När en ny provpunkt kommer in i modellen för förutsägelse och bedömning, varje beslutsträd i den slumpmässiga skogen kommer att göra oberoende bedömningar, och sedan ge relativt korrekta förutsägelseresultat genom majoritetsomröstning. Förutom att bedöma monolager- och dubbellagerproverna, modellen kan också förutsäga sprickor och slumpmässigt fördelade kärnor som lätt introduceras under provtillväxt.
Forskningsprogrammet som föreslås i detta arbete introducerar maskininlärningsalgoritmer i studiet av tvådimensionell materialspektroskopi, och kan utökas till andra material, tillhandahålla viktiga lösningar för materialkaraktärisering inom olika områden.