Teamets metod förutspådde förhållandet mellan luftföroreningar i städerna och trafikflödet mer exakt än befintliga metoder, särskilt för prognoser på längre sikt. Kredit:KAUST; Heno Hwang
En partiell matchningsmetod kan övervinna dimensionalitetens "förbannelse" av kontinuerliga mätningar över tid för att ge mer exakta framtida förutsägelser.
Genom att skanna tidigare data för både partiella och fullständiga matchningar till aktuella observationer, en KAUST-ledd forskargrupp har utvecklat ett förutsägelseschema som mer tillförlitligt kan förutse miljöparametrarnas framtida bana.
Insamling av data med jämna mellanrum över tiden är vanligt inom många områden men särskilt inom miljö, transporter och biologisk forskning. Sådana data används för att övervaka och registrera det aktuella tillståndet och även för att förutsäga vad som kan komma i framtiden. Ett typiskt tillvägagångssätt är att leta efter tidigare mönster eller banor i data som matchar den aktuella banan.
Dock, i praktiken, det finns aldrig några fullständiga matchningar, och därför måste prediktorn hitta mindre och mindre tidsfönster i tidigare data som ger en partiell matchning. Detta resulterar i en förlust av sammanhang och alla bredare trender som kan ha gett en bättre förutsägelse, samtidigt som det eventuellt drar in slumpmässigt brus.
"Att förutsäga framtida tidsseriebanor är utmanande eftersom banorna är sammansatta av många sekventiella observationer eller" dimensioner, "som begränsar multivariata förutsägelsemetoder, " säger Hernando Ombao från KAUST. "Detta är känt som dimensionalitetens förbannelse."
För att övervinna dessa utmaningar, postdoc Shuhao Jiao utvecklade en metod som kallas partiell funktionell förutsägelse (PFP) som integrerar information från alla tidigare fullständiga och partiella banor. Detta optimerade tillvägagångssätt använder all tillgänglig data, fångar både långsiktiga trender och väl matchade delbanor.
"Genom att jämna ut banorna, vi kan förvandla förbannelsen till en välsignelse genom att fånga den stora bilden av banornas dynamiska information, " säger Jiao. "Vår metod inkluderar både tvärbanan och intrabanan beroende, som tidigare metoder inte har uppnått."
Tillvägagångssättet innebär en stegvis procedur där data först analyseras för längre hela banor, de "resterande" delkomponenterna extraheras sedan som fragment oberoende av tidigare trender och allt som blir över tilldelas slumpmässigt brus. De tre funktionerna appliceras sedan på prediktionsfönstret.
Laget, tillsammans med medarbetare Alexander Aue från University of California, demonstrerade sin metod för att förutsäga fina partiklar i luft- och trafikflödet och visade att deras PFP-metod gav mycket mer exakta förutsägelser än befintliga metoder, särskilt för prognoser på längre sikt.
"Vår metod visar att genom att införliva beroendeinformation inom och över banor, det är möjligt att uppnå en uttalad förbättring i förutsägelsen av framtida banor, " säger Ombao.