Modellering av miljödata, t.ex. regional vindhastighet eller temperatur, är en komplicerad verksamhet. För att statistiskt modellera data krävs signifikanta antaganden om dess beteende över tid och rum - men för att nå dessa antaganden krävs en förståelse av data som i allmänhet endast kan erhållas genom modellering. Det är en fångst-22 som utgör ett stort hinder för framsteg inom storskalig miljö- och klimatmodellering, särskilt för extrema händelser.
KAUST -forskaren Raphaël Huser, i samarbete med kollegor från Frankrike och Schweiz, har nu utvecklat ett modelleringsramverk som låter data definiera sitt eget beteende kring extrema händelser utan att behöva begränsa förutbestämda antaganden.
"Extrema miljöer, som extrema vindbyar, översvämningar, eller värmeböljor, är ofta rumsligt beroende, "förklarar Huser." Det vill säga, två närliggande mätstationer kan och gör ofta, uppleva extrema händelser samtidigt. Men stabiliseras eller försvagas detta beroende när händelsen blir mer extrem? Klassiska statistiska modeller kräver att detta extrema beroende är definierat innan modellering, men eftersom extrema händelser är knappa, Det kan vara mycket svårt om inte omöjligt att gissa beroendeklassen i förväg. "
Klassiska statistiska modeller som redogör för extrema händelser kallas asymptotiska modeller. Valet av asymptotisk extremalberoende typ avgör hur modellen extrapolerar till händelser som är ännu mer extrema än de som finns i data. Det kommer med andra underförstådda antaganden som inte alltid är realistiska miljömässigt, med det resultat att sådana modeller felaktigt kan bedöma sannolikheten för framtida extrema händelser.
"Vi utvecklade en serie flexibla geostatistiska" subasymptotiska "modeller med en allmän Gaussisk grund som fångar båda typerna av asymptotiskt beroende, "säger Huser." Våra modeller är mer flexibla och lättare att använda, särskilt för data med högre dimension som samlats in på många övervakningsstationer. "
Genom simuleringar av uppmätta vindhastigheter, Husers team visade att deras blandningar i Gauss-skala kan exakt uppskatta den extrema beroende typen. Det överträffar också andra typiska modeller över en rad prestandamätningar med en bra passform till data och mer realistiska rumsliga förutsägelser av extrema vindhastigheter på oobserverade platser.
"Det viktigaste resultatet av vårt arbete är att vi inte längre behöver fixa den asymptotiska beroendeklassen i förväg utan kan låta data tala för sig själv, "säger Huser." Den här modellen är tillämplig på ett brett spektrum av miljödata och hjälper till att förbättra vår modellering och förutsägelse av extrema händelser. "