Kredit:Unsplash/CC0 Public Domain
En ny grundmodell kallad RingMo har utvecklats för att förbättra noggrannheten för tolkning av fjärranalysbilder, enligt Aerospace Information Research Institute (AIR), Chinese Academy of Sciences (CAS).
Studien med titeln "RingMo:A Remote Sensing Foundation Model with Masked Image Modeling" publicerades i IEEE Transactions on Geoscience and Remote Sensing .
Fjärranalysbilder används inom områden som klassificering och förändringsdetektering, och metoder för djupinlärning har bidragit till den snabba utvecklingen av tolkning av fjärranalysbilder. Det mest använda träningsparadigmet är användningen av ImageNet-förutbildade modeller för att bearbeta fjärranalysdata för specificerade uppgifter.
Det finns dock problem, såsom ett domängap mellan naturliga och fjärranalysscener och den dåliga generaliseringskapaciteten hos fjärranalysmodeller. Därför är det nödvändigt att utveckla en grundmodell med allmän fjärranalysfunktionsrepresentation. Eftersom en stor mängd omärkt data finns tillgänglig är den självövervakade metoden bättre än den helt övervakade metoden vid fjärranalys.
Studien syftar till att föreslå ett ramverk för en grundmodell för fjärranalys, som kan utnyttja fördelarna med generativ självövervakad inlärning för fjärranalysbilder. RingMo har en storskalig datauppsättning konstruerad genom att samla in 2 miljoner fjärranalysbilder från satellit- och flygplattformar, som täcker flera scener och objekt runt om i världen. Dessutom är träningsmetoden för fjärranalys av grundmodellen designad för täta och små föremål i komplicerade fjärranalysscener.
RingMo är den första generativa grundmodellen för cross-modal fjärranalysdata. I framtiden kan modellen tillämpas på 3D-rekonstruktion, bostadsbyggande, transport, vattenskydd, miljöskydd och andra områden. + Utforska vidare