PM2.5-övervakningsinstrumenten vid State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry (LAPC), Institutet för atmosfärsfysik, kinesiska vetenskapsakademin. Kredit:TANG Xiao
Övervakningsdata för omgivande luftkvalitet utgör den viktigaste källan för allmänhetens medvetenhet om luftkvalitet, och används ofta inom många forskningsområden, som förbättring av luftkvalitetsprognoser och analys av disepisoder. Dock, det finns extremvärden bland sådana övervakningsdata, på grund av instrumentfel, påverkan av tuffa miljöer, och begränsningen av mätmetoder.
I praktiken, manuell inspektion används ofta för att identifiera dessa extremvärden. Dock, eftersom mängden data växer snabbt, denna metod blir allt mer besvärlig.
För att hantera problemet, Dr Wu Huangjian och docent Tang Xiao från Institute of Atmospheric Physics, kinesiska vetenskapsakademin, föreslå en helautomatisk metod för upptäckt av extremvärden baserad på sannolikheten för rester. Metoden använder flera regressionsmetoder, och regressionsresterna används för att särskilja extremvärden. Baserat på standardavvikelserna för resterna, sannolikheter för residualerna kan beräknas, och observationerna med små sannolikheter taggas som extremvärden och tas bort av ett datorprogram. Deras resultat publiceras i Framsteg inom atmosfärsvetenskap .
"Genom att introducera sannolikheterna för rester, flera regler kan användas för att identifiera extremvärden på samma ram, " säger Dr Wu. "Till exempel, genom att anta att resterna av rumslig regression och tidsregression följer en bivariat normalfördelning, rumsliga och tidsmässiga konsistenser kan utvärderas samtidigt för bättre identifiering av extremvärden".
Metoden kan flagga potentiellt felaktiga data i timobservationerna från 1436 stationer i China National Environmental Monitoring Center (CNEMC) inom en minut. Verkligen, den har använts i CNEMC:s luftkvalitetsprognossystem, och kommer att integreras i datahanteringssystemet. Förhoppningen är att extremvärden i systemets luftkvalitetsdata i realtid ska tas bort inom en snar framtid.
Metoden publiceras i Framsteg inom atmosfärsvetenskap .