Även om bildnedsättningsalgoritmer har genomgått omfattande forskning och framsteg under de senaste decennierna, kräver klassiska färgnedsättningstekniker ofta många iterationer för deras slutledning, vilket gör dem mindre lämpliga för realtidsapplikationer.
Tillkomsten av djupa neurala nätverk (DNN) har inlett ett paradigmskifte, vilket möjliggör utvecklingen av icke-iterativa, framkopplade digitala bildnedsättningsmetoder.
Dessa DNN-baserade metoder uppvisar anmärkningsvärd effektivitet och uppnår prestanda i realtid samtidigt som de bibehåller hög noggrannhet för ljudavgivning. Dessa djupinlärningsbaserade digitala denoisers medför dock en avvägning och kräver resurs- och kraftkrävande grafikprocessorenheter (GPU) för höga kostnader.
I en artikel publicerad i Light:Science &Applications , ett team av forskare, ledda av professorerna Aydogan Ozcan och Mona Jarrahi från University of California, Los Angeles (UCLA), USA, och professor Kaan Akşit från University College London (UCL), Storbritannien utvecklade en fysisk bildavskiljare som består av rumsligt konstruerade diffraktiva lager att bearbeta brusiga ingångsbilder med ljusets hastighet och syntetisera brusfria bilder vid dess utgående synfält utan någon digital beräkning.
Efter en engångsutbildning på en dator, tillverkas den resulterande visuella processorn med sina passiva diffraktiva lager, och bildar en fysisk bildbetonare som sprider ut de optiska lägena som är associerade med oönskat brus eller rumsliga artefakter hos ingångsbilderna.
Genom sin optimerade design bevarar denna diffraktiva visuella processor de optiska lägena som representerar de önskade rumsliga egenskaperna hos ingångsbilderna med minimala förvrängningar.
Som ett resultat syntetiserar den omedelbart försvagade bilder inom sitt utgående synfält utan att behöva digitalisera, lagra eller överföra en bild för en digital processor att agera på den. Effektiviteten av denna helt optiska bildnedsättningsmetod validerades genom att undertrycka salt- och pepparbrus från både intensitets- och faskodade ingångsbilder.
Dessutom demonstrerades detta fysiska bildnedsättningsramverk experimentellt med hjälp av terahertzstrålning och en 3D-tillverkad diffraktiv denoiser.
Detta helt optiska ramverk för bildnedböjning erbjuder flera viktiga fördelar, såsom låg strömförbrukning, ultrahög hastighet och kompakt storlek.
Forskargruppen föreställer sig att framgången för dessa helt optiska bildavkännare kan katalysera utvecklingen av helt optiska visuella processorer som är skräddarsydda för att hantera olika omvända problem inom bildbehandling och avkänning.
Mer information: Çağatay Işıl et al, Heloptisk bildnedsättning med en diffraktiv visuell processor, Light:Science &Applications (2024). DOI:10.1038/s41377-024-01385-6
Tillhandahålls av UCLA Engineering Institute for Technology Advancement