Att gå från ett manuellt till ett automatiserat experimenterande tillvägagångssätt gör det möjligt för forskare att mer grundligt utforska parameterutrymmen. Med artificiell intelligens (AI) beslutsmetoder, forskare kan komma in på viktiga delar av parameterutrymmet (här, sammansättning och temperatur) för accelererad materialupptäckt. Kredit:Brookhaven National Laboratory
I den populära synen på traditionell vetenskap, forskare är i labbet och svävar över sina experiment, mikrohantera varje liten detalj. Till exempel, de kan iterativt testa en mängd olika materialsammansättningar, syntes- och bearbetningsprotokoll, och miljöförhållanden för att se hur dessa parametrar påverkar materialegenskaper. I varje iteration, de analyserar insamlade data, letar efter mönster och förlitar sig på deras vetenskapliga kunskap och intuition för att välja användbara följdmätningar.
Detta manuella tillvägagångssätt förbrukar begränsad instrumenttid och uppmärksamhet från mänskliga experter som annars skulle kunna fokusera på helheten. Manuella experiment kan också vara ineffektiva, speciellt när det finns en stor uppsättning parametrar att utforska, och är föremål för mänsklig fördom – till exempel, att bestämma när man har samlat in tillräckligt med data och kan stoppa ett experiment. Det konventionella sättet att göra vetenskap kan inte skalas för att hantera den enorma komplexiteten i framtida vetenskapliga utmaningar. Framsteg inom vetenskapliga instrument och dataanalysmöjligheter vid experimentanläggningar fortsätter att möjliggöra snabbare mätningar. Även om dessa framsteg kan hjälpa forskare att ta itu med komplexa experimentella problem, de förvärrar också den mänskliga flaskhalsen; ingen människa kan hänga med i moderna experimentella verktyg!
Föreställer sig automatisering
En sådan anläggning som hanterar dessa typer av utmaningar är National Synchrotron Light Source II (NSLS-II) vid U.S. Department of Energy's (DOE) Brookhaven National Laboratory. Genom att rikta ljusstrålar, allt från infraröd till hård röntgenstrålning, mot prover vid experimentstationer (strållinjer), NSLS-II kan avslöja elektroniska, kemisk, och atomära strukturer av material. När forskare designade dessa strållinjer för ett decennium sedan, de hade förutseendet att införliva automatisering som möjliggörs av maskininlärning (ML) och artificiell intelligens (AI) – nu ett exploderande fält – som en del av deras vision.
"Vi trodde, skulle det inte vara bra om forskare inte bara kunde göra mätningar snabbare utan också göra intelligent utforskning – det vill säga, utforska vetenskapliga problem på smartare, effektivare sätt genom att utnyttja moderna datavetenskapliga metoder, sa Kevin Yager, ledare för Electronic Nanomaterials Group av Center for Functional Nanomaterials (CFN) vid Brookhaven Lab. "Faktiskt, på CFN, vi har definierat ett av våra forskningsteman som accelererad upptäckt av nanomaterial."
Den här idén om en högautomatiserad strållinje som intelligent kunde utforska vetenskapliga problem blev ett långsiktigt mål för Complex Materials Scattering (CMS) strållinjen, utvecklad och drivs av ett team som leds av Masafumi Fukuto.
"Vi började med att bygga högkapacitetskapacitet för snabba mätningar, som en provbytesrobot och massor av in-situ verktyg för att utforska olika parametrar som temperatur, ångtryck, och fuktighet, " sade Fukuto. "Samtidigt, vi började fundera på att automatisera inte bara beamline-hårdvaran för datainsamling utan även realtidsdataanalys och experimentellt beslutsfattande. Förmågan att göra mätningar mycket snabbt är användbar och nödvändig men inte tillräcklig för revolutionerande materialupptäckt eftersom materialparameterutrymmen är mycket stora och flerdimensionella."
Till exempel, ett experiment kan ha ett parameterutrymme med fem dimensioner och fler än 25, 000 distinkta punkter inom det utrymmet att utforska. Både datainsamling och analysmjukvara för att hantera dessa stora, högdimensionella parameterutrymmen byggdes i huset i Brookhaven. För datainsamling, de byggde ovanpå Bluesky-mjukvaran, som NSLS-II utvecklat. För att analysera data, Yager skrev kod för ett bildanalysprogram som heter SciAnalysis.
Stänger slingan
Under 2017, Fukuto och Yager började samarbeta med Marcus Noack, sedan postdoc och nu forskare vid Center for Advanced Mathematics for Energy Research Applications (CAMERA) vid DOE:s Lawrence Berkeley National Laboratory. Under sin tid som postdoc, Noack fick i uppdrag att samarbeta med Brookhaven-teamet om deras autonoma strållinjekoncept. Specifikt, de arbetade tillsammans för att utveckla den sista biten för att skapa en helt automatiserad experimentell uppställning:en beslutsalgoritm. Brookhaven-teamet definierade sina behov, medan Noack tillhandahöll sin tillämpade matematikexpertis och skrev programvaran för att möta dessa behov.
Genom att utnyttja AI och ML, denna algoritm bestämmer de bästa nästa mätningarna att göra medan ett experiment pågår. (AI hänvisar till en maskin som simulerar mänskligt beteende, medan ML är ett underfält av AI där en maskin automatiskt lär sig av tidigare data.) För att algoritmen ska börja modellera ett system, det är så enkelt som att en användare definierar indata och utdata:vilka variabler kan jag kontrollera i experimentet, och vad ska jag mäta? Men ju mer information människor ger i förväg – som systemets förväntade respons eller kända begränsningar baserat på det specifika problemet som studeras – desto mer robust blir modelleringen. Bakom kulisserna, en Gaussisk process pågår och modellerar systemets beteende.
"En Gaussisk process är ett matematiskt rigoröst sätt att uppskatta osäkerhet, " förklarade Yager. "Det är ett annat sätt att säga kunskap i mitt sinne. Och det är ett annat sätt att säga vetenskap. För inom vetenskapen, det är det vi är mest intresserade av:Vad vet jag, och hur väl känner jag till det?"
"Det är ML-delen av det, " tillade Fukuto. "Algorithmen går ett steg längre än så. Den fattar automatiskt beslut baserat på denna kunskap och mänskliga input för att välja vilken punkt som skulle vara vettig att mäta nästa."
I ett förenklat fall, nästa mätning skulle vara platsen i parameterutrymmet där informationsvinsten kan maximeras (eller minska osäkerheten). Teamet demonstrerade först detta proof of concept 2019 vid NSLS-II CMS-strållinjen, avbilda en nanomaterialfilm gjord speciellt för denna demonstration.
Sedan denna första framgång, teamet har gjort algoritmen mer sofistikerad, att använda det för att studera ett brett spektrum av verkliga (istället för konstruerade) vetenskapliga problem från olika grupper, och utvidga den till mer experimentella tekniker och anläggningar.
Medan standardversionen av algoritmen syftar till att minimera osäkerhet eller maximera kunskapsvinst på ett iterativt sätt, det finns andra sätt att tänka på var man ska fokusera experimentell uppmärksamhet för att få mest värde. Till exempel, för vissa vetenskapsmän, kostnaden för experimentet – oavsett om dess varaktighet eller mängd material som används – är viktig. Med andra ord, det är inte bara var du tar data men hur dyr det är att ta dessa uppgifter. Andra kan finna värde i att leta efter specifika egenskaper, såsom gränser inom ett parameterutrymme eller kornstorlek för en kristall. Ju mer sofistikerade, flexibel version av algoritmen som Noack utvecklat kan programmeras att ha ökad känslighet för dessa funktioner.
"Du kan ställa in vad dina mål är i experimentet, " förklarade Yager. "Så, det kan vara kunskapsvinst, eller kunskapsvinst som regleras av experimentella kostnader eller förknippas med specifika egenskaper."
Andra förbättringar inkluderar algoritmens förmåga att hantera komplexiteten i verkliga system, som det faktum att material är inhomogena, vilket betyder att de inte är lika vid varje punkt i ett prov. En del av ett prov kan ha en enhetlig sammansättning, medan en annan kan ha en varierande sammansättning. Dessutom, Algoritmen tar nu hänsyn till anisotropi, eller hur enskilda parametrar kan skilja sig mycket från varandra när det gäller hur de påverkar ett system. Till exempel, "x" och "y" är ekvivalenta parametrar (de är båda positionskoordinater) men temperatur och tryck är det inte.
"Gaussiska processer använder kärnor - funktioner som beskriver hur datapunkter är beroende av varandra över rymden - för interpolering, " sade Noack. "Kärnor har alla möjliga intressanta matematiska egenskaper. Till exempel, de kan koda för olika grader av inhomogenitet för ett prov."
Att öka sofistikeringen av algoritmen är bara en del av utmaningen. Sedan, Fukuto och Yager måste integrera den uppdaterade algoritmen i det automatiserade experimentella arbetsflödet med slutna slinga och testa det på olika experiment – inte bara de som görs internt utan också de som utförs av användare.
Att implementera metoden till det större forskarsamhället
Nyligen, Fukuto, Yager, Noack, och kollegor har distribuerat den autonoma metoden till flera verkliga experiment vid olika NSLS-II-strållinjer, inklusive CMS och Soft Matter Interfaces (SMI). Noack och medarbetare har också implementerat metoden vid LBNL:s Advanced Light Source (ALS) och Institut Laue-Langevin (ILL), en neutronspridningsanläggning i Frankrike. Teamet släppte sin programvara för beslutsfattande, gpCAM, till det bredare forskarsamhället så att vem som helst kunde sätta upp sina egna autonoma experiment.
I ett experiment, i samarbete med U.S. Air Force Research Laboratory (AFRL), de använde metoden i ett autonomt synkrotronröntgenspridningsexperiment vid CMS-strållinjen. Vid röntgenspridning, röntgenstrålarna studsar av ett prov i olika riktningar beroende på provets struktur. Det första målet med experimentet var att utforska hur den ordnade strukturen hos nanorod-polymerkompositfilmer beror på två tillverkningsparametrar:filmbeläggningens hastighet och substratets kemiska beläggning. Det andra målet var att använda denna kunskap för att lokalisera och komma in i de regioner av filmerna med de högsta graderna av ordning.
"Dessa material är av intresse för optiska beläggningar och sensorer, " förklarade CMS strållinjeforskaren Ruipeng Li. "Vi använde en speciell tillverkningsmetod som efterliknar industriella roll-to-roll-processer för att ta reda på det bästa sättet att forma dessa ordnade filmer med hjälp av industriellt skalbara processer."
I ett annat experiment med röntgenspridning, vid SMI-strållinjen, Algoritmen identifierade framgångsrikt områden av oväntad ordning i ett parameterutrymme som är relevant för självmontering av blocksampolymerfilmer. Blocksampolymerer är polymerer uppbyggda av två eller flera kemiskt distinkta "block" sammanlänkade. Genom att identifiera dessa egenskaper, det autonoma experimentet belyste ett problem med tillverkningsmetoden.
"Det var inte hypotetiskt – vi har arbetat med det här projektet i många år, " sa CFN-materialforskaren Gregory Doerk. "Vi hade itererat på det gamla sättet, gör några experiment, ta bilder på platser vi godtyckligt valt, tittar på bilderna, och blir förbryllad över vad som händer. Med det autonoma förhållningssättet, under en dag av experiment vid strållinjen, vi kunde hitta defekterna och sedan omedelbart åtgärda dem i nästa omgång. Det är en dramatisk acceleration av den normala forskningscykeln där du gör en studie, ta reda på att det inte fungerade, och gå tillbaka till ritbordet."
Noack och hans medarbetare tillämpade också metoden på en annan typ av röntgenteknik som kallas autonom synkrotron infraröd kartläggning, som kan ge kemisk information om ett prov. Och de visade hur metoden kunde tillämpas på en spektroskopiteknik för att autonomt upptäcka faser där elektroner beter sig på ett starkt korrelerat sätt och på neutronspridning för att autonomt mäta magnetiska korrelationer.
Forma framtiden för autonoma experiment
Enligt Yager, deras metod kan tillämpas på vilken teknik som helst där datainsamlingen och dataanalysen redan är automatiserad. En av fördelarna med tillvägagångssättet är att det är "fysikagnostisk, "det betyder att det inte är knutet till någon speciell typ av material, fysiska problem, eller teknik. De fysiskt betydelsefulla kvantiteterna för beslutsfattandet extraheras genom analys av rådata.
"Vi ville göra vårt tillvägagångssätt väldigt generellt så att det kunde tillämpas på vad som helst och sedan skräddarsys efter specifika problem, " sa Yager. "Som en användaranläggning, vi vill ge det största antalet människor möjlighet att göra intressant vetenskap."
I framtiden, teamet kommer att lägga till funktionalitet för användare att införliva fysikmedvetenhet, eller kunskap om de material eller fenomen de studerar, om de vill. Men teamet kommer att göra det på ett sätt som inte förstör tillvägagångssättets allmänna flexibilitet; användare kommer att kunna aktivera eller inaktivera denna extra kunskap.
En annan aspekt av framtida arbete är att tillämpa metoden för att styra realtidsprocesser – med andra ord, styra ett system som dynamiskt utvecklas i tiden som ett experiment fortskrider.
"Fram till denna punkt, vi har koncentrerat oss på att fatta beslut om hur vi ska mäta eller karakterisera förberedda materialsystem, ", sa Fukuto. "Vi vill också fatta beslut om hur vi ska byta material eller vilka typer av material vi vill göra. Att förstå den grundläggande vetenskapen bakom materialförändringar är viktigt för att förbättra tillverkningsprocesser."
Att förverkliga denna förmåga att intelligent utforska material som utvecklas i realtid kommer att kräva att man övervinner algoritmiska och instrumenteringsutmaningar.
"Beslutsfattandet måste vara väldigt snabbt, och du måste bygga provmiljöer för att göra materialsyntes i realtid medan du gör mätningar med en röntgenstråle, " förklarade Yager.
Trots dessa utmaningar, teamet är spända på vad framtiden för autonoma experiment har att erbjuda.
"Vi startade detta arbete i mycket liten skala, men det växte till något mycket större, " sa Fukuto. "Många människor är intresserade av det, inte bara vi. Användargemenskapen har expanderat, och med användare som studerar olika typer av problem, detta tillvägagångssätt kan ha en stor inverkan på att påskynda en mängd vetenskapliga upptäckter."
"Det representerar en riktigt stor förändring i tänkandet att gå från det gamla sättet att mikrohantera experiment till denna nya vision av automatiserade system som kör experiment med människor som orkestrerar dem på en mycket hög nivå eftersom de förstår vad som behöver göras och vad vetenskapen betyder, ", sa Yager. "Det är en mycket spännande vision för vetenskapens framtid. Vi kommer att kunna ta itu med problem i framtiden som folk för 10 år sedan skulle ha sagt är omöjliga."