• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • 3D-modeller från billiga videokameror

    Kredit:Linköpings universitet

    Hannes Ovrén visar i sin doktorsavhandling i datorsyn vid Linköpings universitet hur 3D-modeller kan skapas från videofilmer inspelade med enkla kropps- eller robotmonterade kameror. Forskningen öppnar nya möjligheter för både robotar och människor, inte minst för polis och räddningstjänst.

    Forskning inom datorsyn har en stor betydelse för framtiden för artificiell intelligens:autonoma system förlitar sig på robotarnas och andra systems förmåga att orientera sig och upptäcka föremål och människor.

    Hannes Ovréns bidrag visar hur man skapar en 3D-modell av omgivningen, baserat på videofilmer tagna med en billig kroppsbyggd kamera. Modellen återger skalan exakt, så att mätningar kan göras.

    "För närvarande, se robotar röra sig ganska försiktigt, för att hålla reda på var de är. I vissa fall, de kan till och med behöva stanna för att bestämma sin plats. Denna teknik gör att robotar kan röra sig mer fritt och konstruera en modell av omgivningen medan de rör sig, säger Per-Erik Forssén, docent vid Computer Vision Laboratory, och Hannes Ovréns huvudhandledare.

    Andra användningsområden finns i, till exempel, polisarbete eller räddningsarbete, där personal med kroppsbyggd kamera kan återskapa en brottsplats eller en olycksplats i tre dimensioner, med människor och föremål på den exakta platsen de hade i det ögonblick fotot togs.

    Kredit:Linköpings universitet

    Problemet med att skapa 3D-modeller från enkla videokameror har hittills varit att kameran måste stå stilla, helst monterad på ett stativ. Om kameran rör sig, raka föremål kan tyckas vara böjda i bilden, eller verkar vara på olika höjder. Objekt vingla, och en förvrängd bild erhålls. Detta beror på att billiga kameror har en typ av slutare som kallas en "rullande" slutare, som bygger upp bilden i pixlar rad för rad. Smartphones har denna typ av kamera.

    "Varje bildram innehåller rörelse, men det är möjligt att förbättra bilden avsevärt genom att modellera hur kameran har rört sig och kompensera för rörelsen, säger Hannes Ovrén.

    För att förhindra att beräkningarna blir för krävande, hans metod skapar en kurva, känd som en "spline, "som beskriver hur kameran har rört sig. Denna kurva är konstruerad av spline knutar, där varje knut styr kurvens utseende vid en viss tidpunkt. Om knutarna placeras tätare, metoden kan hantera mer komplex rörelse, men beräkningarna blir mer krävande.

    Hannes Ovrén visar i avhandlingen att det är möjligt att använda betydligt färre knop när de fel som uppstår på grund av kurvens utjämning och utjämning modelleras. För att förhindra att felen blir för stora, metoden använder också en tröghetsmätningsenhet ansluten till kameran. Detta är en liten och billig sensor som spårar acceleration, vinkelhastighet och orientering i förhållande till marken.

    Skapande av en 3D-modell. Kredit:Hannes Ovrén

    "Mätningarna från sensorn ingår i beräkningarna och vi kan på så sätt öka avståndet mellan knop, minska beräkningarnas storlek, säger Hannes Ovrén.

    Förenklingen innebär att kamerans rörelse och spline -kurvan inte är exakt samma. Det är möjligt, dock, för att avgöra hur skillnaden i väg påverkar mätfelens storlek, och på så sätt öka tillförlitligheten för 3D-modellen och avstånden i den.


    © Vetenskap https://sv.scienceaq.com