modellera moln, speciellt i små skalor, kan vara svårt för forskare. Kredit:NASA Goddard Space Flight Center
I dag, att förutsäga vad framtiden har i beredskap för jordens klimat innebär att hantera osäkerheter. Till exempel, de centrala klimatprognoserna från Intergovernmental Panel on Climate Change (IPCC) har satt den globala temperaturökningen från en fördubbling av atmosfärisk koldioxid 2 nivåer – kallade "klimatkänslighet" – någonstans mellan 1,5 grader C och 4,5 C. Det gapet, som inte har visats sedan den första IPCC-rapporten 1990, har djupgående konsekvenser för den typ av miljöhändelser som mänskligheten kanske vill förbereda sig för.
En del av osäkerheten uppstår på grund av otvingad variabilitet – förändringar som skulle inträffa även i frånvaro av ökningar av CO 2 — men en del av det uppstår på grund av behovet av modeller för att simulera komplexa processer som moln och konvektion. Nyligen, klimatforskare har försökt att begränsa osäkerhetsintervallen i klimatmodeller genom att använda en nyligen genomförd revolution inom datavetenskap. Maskininlärning, som redan distribueras för en mängd applikationer (läkemedelsupptäckt, flygledning, och programvara för röstigenkänning, till exempel), expanderar nu till klimatforskning, med målet att minska osäkerheten i klimatmodeller, specifikt när det gäller klimatkänslighet och att förutsäga regionala trender, två av de största bovarna till osäkerhet.
Paul O'Gorman, en docent vid MIT Department of Earth, Atmospheric and Planetary Sciences (EAPS) och medlem av programmet i Atmospheres, Hav och klimat, diskuterar var maskininlärning passar in i klimatmodellering, möjliga fallgropar och deras botemedel, och områden där tillvägagångssättet sannolikt kommer att vara mest framgångsrikt.
F:Klimatkänslighet och regionala klimatförändringar verkar vara en källa till frustration för forskare. Vad finns det för hinder där, och hur kan maskininlärning hjälpa?
S:Dagens klimatmodeller är redan mycket användbara å ena sidan, men de står också inför mycket utmanande problem, varav två du nämnde – klimatkänslighet för en fördubbling av koldioxiden och regionala aspekter av klimatförändringar, till exempel, hur nederbörden förändras i ett visst land. För båda dessa frågor skulle vi vilja ha mer exakta klimatmodeller, och de måste också vara snabba eftersom de måste köras i mer än tusen år, vanligtvis, bara för att komma in i det nuvarande klimatläget innan de går vidare till framtida klimat.
Så det är en fråga om både noggrannhet och effektivitet. Traditionellt, klimatmodeller är till stor del baserade på atmosfärens och havets fysik och kemi, och processer vid landytan. Men de kan inte inkludera allt som händer i atmosfären ner till millimeterskalan eller mindre, så de måste inkludera några empiriska formler. Och de empiriska formlerna kallas parameteriseringar. Parameteriseringar representerar komplexa processer, som moln och atmosfärisk konvektion – ett exempel på det skulle vara åskväder – som händer i liten skala jämfört med jordens storlek, så de är svåra för globala klimatmodeller att representera korrekt.
En idé som har kommit i förgrunden under de senaste åren är att använda maskininlärning för att mer exakt representera dessa småskaliga aspekter av atmosfären och havet. Tanken vore att driva en mycket dyr, högupplöst modell som kan lösa processen du är intresserad av, till exempel, grunda moln, och använd sedan maskininlärning för att lära av dessa simuleringar. Det är första steget. Det andra steget skulle vara att införliva den maskininlärda algoritmen i en klimatmodell för att ge, förhoppningsvis, en snabbare och mer exakt klimatmodell. Och det är vad flera grupper runt om i världen utforskar.
F:I vilken utsträckning kan den maskininlärda algoritmen generalisera från en klimatsituation, eller en region, till en annan?
A:Det är ett stort frågetecken. Vad vi har funnit hittills är att om du tränar på det nuvarande klimatet och försöker simulera ett mycket varmare klimat, maskininlärningsalgoritmen kommer att misslyckas eftersom den förlitar sig på analogier till situationer i det nuvarande klimatet som inte sträcker sig till det varmare klimatet med högre temperaturer. Till exempel, molnen i atmosfären tenderar att gå högre i ett varmare klimat. Så det är en begränsning om du bara tränar på det nuvarande klimatet, men självklart är det också möjligt att träna på varmare klimat i högupplösta modeller.
Intressant, vi fann för atmosfärisk konvektion att om du tränar på det nuvarande klimatet och sedan går till ett kallare klimat, maskininlärningsmetoden fungerar bra. Så det finns en asymmetri mellan uppvärmning eller kylning och hur väl dessa algoritmer kan generalisera, åtminstone för fallet med atmosfärisk konvektion. The reason that the machine learning algorithm can generalize in the case of a cooling climate is that it can find examples at higher latitudes in the current climate to match the tropics of the colder climate. So different climates in different regions of the world help with generalization for climate change.
The other thing that may help is events like El Niño, where the global atmosphere on average gets a bit warmer, and so that could provide an analogy from which to learn. It's not a perfect analogy with global warming, but some of the same physics may be operating at higher temperatures so that could be something that the machine learning algorithm would automatically leverage to help to generalize to warmer climates.
Q:Does that mean there are certain areas of the climate system that machine learning will work better for versus others?
A:I was suggesting that we should train our machine learning algorithms on very expensive high-resolution simulations, but that only makes sense, självklart, if we have accurate high-resolution simulations for the process we are interested in. What we've been studying—atmospheric convection—is a good candidate because we can do quite accurate high-resolution simulations.
Å andra sidan, if one was interested in, till exempel, how the land surface responds to climate change and how it interacts with the atmosphere above it, it's more difficult because there's lots of complexity. We have different types of plants, different soil. It's very heterogeneous. It's not as straightforward to get the truth from which you want to learn from models in that case. And then if we say, "Well, for aspects of the climate system that don't have accurate expensive simulations, can we instead use observations?" Perhaps. But then we come back to the problem of trying to generalize to a different climate. So, I definitely think there are different parts of the climate system that are more amenable to the machine learning approach than others.
Också, some aspects of climate model simulations are already very good. Models are already doing well in simulating the large scale fluid dynamics of the atmosphere, till exempel. So those parts of climate models are very unlikely to be replaced with machine learning approaches that would be less flexible than a purely physics-based approach.
Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.