Ett team av forskare har använt AI för att identifiera ett termoelektriskt material med gynnsamma värden. Gruppen kunde navigera i AI:s konventionella fallgropar och big data-utmaningar, och erbjöd ett utmärkt exempel på hur AI kan revolutionera materialvetenskap. Detaljer publicerades i tidskriften Science China Materials den 8 mars 2024.
"Traditionella metoder för att hitta lämpliga material involverar trial-and-error, vilket är tidskrävande och ofta dyrt", proklamerar Hao Li, docent vid Tohoku Universitys Advanced Institute for Materials Research (WPI-AIMR) och motsvarande författare till artikeln. "AI omvandlar detta genom att kamma igenom databaser för att identifiera potentiellt material som sedan kan verifieras experimentellt."
Ändå kvarstår utmaningar. Storskaliga materialdatauppsättningar innehåller ibland fel, och att överanpassa de förutspådda temperaturberoende egenskaperna är också ett vanligt fel. Överanpassning uppstår när en modell lär sig att fånga brus eller slumpmässiga fluktuationer i träningsdata snarare än det underliggande mönstret eller sambandet.
Som ett resultat presterar modellen bra på träningsdata men misslyckas med att generalisera ny, osynlig data. När man förutsäger temperaturberoende egenskaper kan överanpassning leda till felaktiga förutsägelser när modellen stöter på nya förhållanden utanför träningsdataområdet.
Li och hans kollegor försökte övervinna detta för att utveckla ett termoelektriskt material. Dessa material omvandlar värmeenergi till elektrisk energi, eller vice versa. Därför är det avgörande att få ett mycket exakt temperaturberoende.
"Först utförde vi en serie rationella åtgärder för att identifiera och förkasta tvivelaktiga data, och erhöll 92 291 datapunkter bestående av 7 295 kompositioner och olika temperaturer från Starrydata2-databasen – en onlinedatabas som samlar in digital data från publicerade tidningar", säger Li.
Sedan byggde forskarna maskinbyggnadsmodeller med metoden Gradient Boosting Decision Tree. Modellen uppnådde anmärkningsvärda R2-värden 0,89, ~0,90 och ~0,89 på träningsdatauppsättningen, testdatauppsättningen och nya experimentdata utanför urvalet som släpptes 2023, vilket visar modellernas noggrannhet när det gäller att förutsäga nyligen tillgängligt material.
"Vi skulle kunna använda den här modellen för att utföra en storskalig utvärdering av de stabila materialen från Materials Project-databasen, förutsäga den potentiella termoelektriska prestandan hos nya material och ge vägledning för experiment", säger Xue Jia, biträdande professor vid WPI-AIMR, och medförfattare till tidningen.
I slutändan illustrerar studien vikten av att följa rigorösa riktlinjer när det gäller dataförbearbetning och datauppdelning i maskininlärning så att den tar itu med de pressande frågorna inom materialvetenskap. Forskarna är optimistiska att deras strategi även kan tillämpas på andra material, såsom elektrokatalysatorer och batterier.
Mer information: Xue Jia et al, Att hantera big data-utmaningarna inom AI för termoelektriska material, Science China Materials (2024). DOI:10.1007/s40843-023-2777-2
Tillhandahålls av Tohoku University