En detaljerad karta över föroreningsnivåerna i Peking och dess omgivningar med en ny maskininlärningsalgoritm för satellitbilder och väder. Upphovsman:Tongshu Zheng, Duke University
Forskare från Duke University har tagit fram en metod för att uppskatta luftkvaliteten över ett litet område med hjälp av satellitbilder och väderförhållanden. Sådan information kan hjälpa forskare att identifiera dolda hotspots för farlig förorening, förbättra studier av föroreningar av människors hälsa kraftigt, eller eventuellt reta ut effekterna av oförutsägbara händelser på luftkvaliteten, såsom utbrottet av en luftburen global pandemi.
Resultaten visas online i tidningen Atmosfärisk miljö .
"Vi har använt en ny generation mikrosatellitbilder för att uppskatta luftföroreningar på marknivå i den minsta rumsliga skalan hittills, "sa Mike Bergin, professor i civil- och miljöteknik vid Duke. "Vi har kunnat göra det genom att utveckla ett helt nytt tillvägagångssätt som använder AI/maskininlärning för att tolka data från ytbilder och befintliga markstationer."
Den specifika mätning av luftkvalitet som Bergin och hans kollegor är intresserade av är mängden små luftburna partiklar som kallas PM2.5. Dessa är partiklar som har en diameter mindre än 2,5 mikrometer - cirka tre procent av diametern på ett människohår - och som har visat sig ha en dramatisk effekt på människors hälsa på grund av deras förmåga att resa djupt in i lungorna.
Till exempel, PM2.5 rankades globalt som den femte riskfaktorn för dödlighet, ansvarig för cirka 4,2 miljoner dödsfall och 103,1 miljoner år av liv förlorat eller levt med funktionshinder, genom Global Burden of Disease -studien 2015. Och i en ny studie från Harvard University T.H. Chan School of Public Health, forskare fann att områden med högre nivåer av PM2,5 också är associerade med högre dödsfall på grund av COVID-19.
Nuvarande bästa praxis för fjärranalys för att uppskatta mängden PM2.5 på marknivå använder satelliter för att mäta hur mycket solljus som sprids tillbaka till rymden av omgivande partiklar över hela atmosfärskolonnen. Den här metoden, dock, kan drabbas av regionala osäkerheter som moln och blanka ytor, atmosfärisk blandning, och egenskaper hos PM -partiklarna, och kan inte göra exakta uppskattningar på skalor mindre än cirka en kvadratkilometer. Medan övervakningsstationer för markföroreningar kan ge direkta mätningar, de lider av sin egen mängd nackdelar och är bara glest belägna runt om i världen.
"Markstationer är dyra att bygga och underhålla, så även stora städer kommer sannolikt inte att ha mer än en handfull av dem, "sa Bergin." Dessutom är de nästan alltid placerade i områden borta från trafik och andra stora lokala källor, så även om de kan ge en allmän uppfattning om mängden PM2,5 i luften, de kommer inte i närheten av att ge en sann fördelning för människorna som bor i olika områden i hela staden. "
I deras jakt på en bättre metod, Bergin och hans doktorand Tongshu Zheng vände sig till Planet, ett amerikanskt företag som använder mikrosatelliter för att ta bilder av hela jordens yta varje dag med en upplösning på tre meter per pixel. Teamet kunde få en daglig bild av Peking under de senaste tre åren.
Det viktigaste genombrottet kom när David Carlson, en biträdande professor i civil- och miljöteknik vid Duke och en expert på maskininlärning, klev in för att hjälpa.
Sex olika bilder tagna av samma område i Peking på olika dagar och upplever olika nivåer av luftföroreningar. Medan det blotta mänskliga ögat tydligt kan berätta att vissa dagar är mer förorenade än andra, en ny maskininlärningsalgoritm kan göra rimligt exakta uppskattningar av luftföroreningar på marknivå. Upphovsman:Tongshu Zheng, Duke University
"När jag går till maskininlärning och konstgjord intelligens konferenser, Jag är vanligtvis den enda personen från en miljöteknisk avdelning, "sa Carlson." Men det här är de exakta typerna av projekt som jag är här för att hjälpa till, och varför Duke lägger så stor vikt vid att anställa dataexperter i hela universitetet. "
Med Carlsons hjälp, Bergin och Zheng applicerade ett konvolutionsnervalt nätverk med en slumpmässig skogalgoritm på bilduppsättningen, kombinerat med meteorologiska data från Pekings väderstation. Även om det kan låta som en munsbit, det är inte så svårt att välja mellan träden.
En slumpmässig skog är en standard algoritm för maskininlärning som använder många olika beslutsträd för att göra en förutsägelse. Vi har alla sett beslutsträd, kanske som en internetmeme som använder en rad förgrenade ja/nej -frågor för att avgöra om man ska äta en burrito eller inte. Förutom i det här fallet, algoritmen tittar igenom beslutsträd baserat på mått som vind, relativ luftfuktighet, temperatur och mer, och använda de resulterande svaren för att komma fram till en uppskattning för PM2,5 -koncentrationer.
Dock, slumpmässiga skogsalgoritmer hanterar inte bra bilder. Det är där de konvolutionella neurala nätverken kommer in. Dessa algoritmer letar efter gemensamma drag i bilder som linjer och stötar och börjar gruppera dem tillsammans. När algoritmen "zoomar ut, "det fortsätter att klumpa ihop liknande grupper, att kombinera grundläggande former till gemensamma funktioner som byggnader och motorvägar. Så småningom kommer algoritmen med en sammanfattning av bilden som en lista över dess vanligaste funktioner, och dessa kastas in i den slumpmässiga skogen tillsammans med väderdata.
"Bilder med hög förorening är definitivt dimmigare och suddigare än vanliga bilder, men det mänskliga ögat kan inte riktigt avgöra de exakta föroreningsnivåerna från dessa detaljer, "sade Carlson." Men algoritmen kan plocka fram dessa skillnader i både lågnivå- och högnivåfunktioner-kanterna är suddigare och former döljs mer-och exakt förvandla dem till uppskattningar av luftkvalitet. "
"Det konvolutionella neurala nätverket ger oss inte en så bra förutsägelse som vi skulle vilja med bilderna ensamma, "tillade Zheng." Men när du sätter dessa resultat i en slumpmässig skog med väderdata, resultaten är lika bra som allt annat som för närvarande är tillgängligt, om inte bättre. "
I studien, forskarna använde 10, 400 bilder för att träna sin modell för att förutsäga lokala nivåer av PM2.5 med bara satellitbilder och väderförhållanden. De testade sin resulterande modell på ytterligare 2, 622 bilder för att se hur bra det kan förutsäga PM2.5.
De visar att i genomsnitt, deras modell är korrekt till inom 24 procent av de faktiska PM2,5 -nivåerna mätt på referensstationer, som ligger i den höga änden av spektrumet för dessa typer av modeller, samtidigt som den har en mycket högre rumslig upplösning. Medan de flesta av de nuvarande standardmetoderna kan förutsäga nivåer ner till 1 miljon kvadratmeter, den nya metoden är exakt ner till 40, 000-ungefär lika stor som åtta fotbollsplaner placerade sida vid sida.
Med den nivån av specificitet och noggrannhet, Bergin tror att deras metod kommer att öppna en mängd nya användningsområden för sådana modeller.
"Vi tror att detta är en enorm innovation när det gäller satellithämtning av luftkvalitet och kommer att vara ryggraden i mycket forskning som kommer, "sa Bergin." Vi börjar redan få förfrågningar om hur vi använder den för att titta på hur PM2.5 kommer att förändras när världen börjar återhämta sig från spridningen av COVID-19. "