Modellen kan tränas i farten för att producera högkvalitativa bilder på bara 12 sekunder. Kredit:Bochang Moon från Gwangju Institute of Science and Technology, Korea
Högkvalitativ datorgrafik, med sin allestädes närvarande närvaro i spel, illustrationer och visualisering, anses vara den senaste inom visuell visningsteknik.
Metoden som används för att återge högkvalitativa och realistiska bilder är känd som "path tracing", som använder sig av en Monte Carlo (MC) denoising-metod baserad på övervakad maskininlärning. I detta inlärningsramverk är maskininlärningsmodellen först förtränad med brusiga och rena bildpar och appliceras sedan på den faktiska brusiga bilden som ska renderas (testbild).
Även om den anses vara den bästa metoden när det gäller bildkvalitet, kanske den här metoden inte fungerar bra om testbilden skiljer sig markant från bilderna som används för träning.
För att komma till rätta med detta problem har en grupp forskare, inklusive Ph.D. student Jonghee Back och docent Bochang Moon från Gwangju Institute of Science and Technology i Korea, forskaren Binh-Son Hua från VinAI Research i Vietnam och docent Toshiya Hachisuka från University of Waterloo i Kanada, föreslog i en ny studie en ny MC denoising-metod som inte förlitar sig på en referens. Deras studie gjordes tillgänglig online den 24 juli 2022 och publicerades i ACM SIGGRAPH 2022 Conference Proceedings .
"De befintliga metoderna misslyckas inte bara när test- och tågdataset är väldigt olika utan tar också lång tid att förbereda träningsdataset för att förträna nätverket. Det som behövs är ett neuralt nätverk som kan tränas med bara testbilder i farten utan att det behövs för förträning", säger Dr Moon och förklarar motivationen bakom deras studie.
För att åstadkomma detta föreslog teamet en ny efterkorrigeringsmetod för en försvagad bild som bestod av ett självövervakat ramverk för maskininlärning och ett postkorrigeringsnätverk, i grunden ett konvolutionellt neuralt nätverk, för bildbehandling. Nätverket efter korrigering var inte beroende av ett förutbildat nätverk och kunde optimeras med hjälp av det självövervakade inlärningskonceptet utan att förlita sig på en referens. Dessutom kompletterade och stärkte den självövervakade modellen de konventionella övervakade modellerna för denoising.
För att testa effektiviteten hos det föreslagna nätverket tillämpade teamet sitt tillvägagångssätt på de befintliga toppmoderna metoderna för denoising. Den föreslagna modellen visade en trefaldig förbättring av den renderade bildkvaliteten i förhållande till ingångsbilden genom att bevara finare detaljer. Dessutom tog hela processen med träning i farten och slutledning bara 12 sekunder.
"Vårt tillvägagångssätt är det första som inte förlitar sig på förträning med hjälp av en extern datauppsättning. Detta kommer i själva verket att förkorta produktionstiden och förbättra kvaliteten på offline-renderingsbaserat innehåll som animationer och filmer", säger Dr. Moon , spekulerar om potentiella tillämpningar av deras arbete. + Utforska vidare