Huang Huang (vänster) och Ying Sun har utvecklat en metod för att visualisera de spatio-temporala kovariansegenskaperna för en datauppsättning, som hjälper till att förstå miljödata. Kredit:KAUST
Förutsägelse av klimat och väder bygger på statistiska modeller som kan fånga variabilitet på en plats över tid såväl som sambandet med andra geografiska platser. Ibland kan framtida förhållanden på en plats förutsägas utifrån nuvarande förhållanden på en annan plats, medan det i andra fall kanske inte finns någon sådan korrelation. Antagandet om huruvida två platser är "samvarierande" på ett eller annat sätt kan ha djupgående konsekvenser för den statistiska modellens noggrannhet, och så valet av rum-tid kovarians är avgörande.
Ying Sun och hennes student Huang Huang från KAUST har nu utvecklat en metod för att visualisera de spatio-temporala kovariansegenskaperna för en datauppsättning, avsevärt förenkla ett viktigt modelleringssteg som tidigare krävde noggrann explorativ dataanalys.
"Vi föreslår ett enkelt och bekvämt sätt att visualisera egenskaperna hos kovariansstrukturen i data, som kommer att hjälpa utövare att välja lämpliga statistiska modeller för kovarianser, " säger Sun. "Särskilt, denna metod är användbar för data som observeras gles i rymden och tät i tid, vilket ofta är fallet för observationer av väderstationer till exempel."
Sun och Huang ansåg två nyckeltyper av kovarians-symmetri och separerbarhet. Symmetri innebär att de rumsliga-temporala processerna är reversibla i tid, medan separerbarhet indikerar att korrelationen i tid inte interagerar med den i rymden.
"Att anta en helt symmetrisk eller separerbar kovarians leder till en mycket enklare modell och därmed snabba beräkningar, " säger Sun. "Men, detta modellantagande kan kränkas i många verkliga tillämpningar, leder till mindre exakta uppskattningar och förutsägelser."
Huang och Sun använde en funktionell dataanalysmetod för att konstruera testfunktioner från kovarianserna i tidsseriedata mellan platspar. Dessa testfunktioner sammanfattar effektivt egenskaperna för separerbarhet eller symmetri och kan visas som boxplots som visar graden av icke-separerbarhet eller asymmetri.
"Vi tillämpade denna metod för meteorologiska observationer och simulerade väderdata från några vanliga klimatmodeller, " säger Huang. "I de rapporterade exemplen för ett studieområde i Nordatlanten, denna metod visade att vindhastighet och yttemperatur har olika kovariansstrukturer under olika årstider."
Visualiseringen kan beräknas relativt snabbt för en handfull övervakningsstationer, och forskarna noterar att beräkningseffektiviteten kan förbättras för ett större antal stationer genom att dela upp problemet i underregioner. Ändå, metoden ger ett värdefullt verktyg som i hög grad kommer att hjälpa utövare.