• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Nytt program plockar ut mål i en folkmassa snabbt och effektivt

    Upphovsman:CC0 Public Domain

    Det kan vara svårare för datorer att hitta Waldo, en svårfångad karaktär som gömmer sig bland folkmassor i en populär barnboksserie, än det är för människor.

    Nu, en A*STAR-forskare och hennes kollegor har utvecklat ett biologiskt inspirerat program som kan göra det möjligt för datorer att identifiera verkliga Waldos och andra mål mer effektivt.

    Datorbildanalys används rutinmässigt inom medicin, säkerhet, och räddning. Hastighet är ofta avgörande i dessa ansträngningar, säger Mengmi Zhang, datavetare vid A*STAR's Institute for Infocomm Research, som ledde studien. Hon citerar användningen av datorer för att hitta offer för naturkatastrofer, som jordbävningar.

    Men dessa ansträngningar försvåras ofta eftersom datorer saknar mänsklig intuition. En person kan snabbt upptäcka en hund i ett trångt utrymme, till exempel, även om de aldrig har sett just den hunden förut. En dator, däremot måste tränas med tusentals bilder av olika hundar, och även då, de kan vackla när de letar efter en ny hund vars image de inte har stött på tidigare.

    Denna svaghet kan vara särskilt problematisk när man söker efter vapen, säger Zhang. En dator tränad att leta efter knivar och vapen, kan förbise ett annat skarpt föremål. "Om det finns en vass metallpinne som inte har setts i träningsuppsättningen, det betyder inte att passageraren ska kunna ta den ombord på flygplanet, säger Zhang.

    Aktuella datorsökningar tenderar också att vara långsamma eftersom datorn måste skanna varje del av en bild i följd, ägna lika stor uppmärksamhet åt varje del. Människor, dock, snabbt flytta sin uppmärksamhet mellan flera olika platser i en bild för att hitta sitt mål. Zhang och hennes kollegor ville förstå hur människor gör detta så effektivt. De presenterade 45 personer med trånga bilder och bad dem att jaga efter ett mål, säga, ett får. De övervakade hur försökspersonernas ögon dartade runt scenen, fixera kort på olika platser i bilden. De fann att, i genomsnitt, människor kunde lokalisera fåren på cirka 640 millisekunder. Detta motsvarade att byta plats för deras blick, i genomsnitt, drygt två och en halv gånger.

    Teamet utvecklade sedan en datormodell för att implementera denna mer mänskliga sökstrategi i jakten på en hund. Istället för att leta efter ett mål som var identiskt med en bild av en hund som gavs i förväg, modellen tränades att leta efter något som hade liknande egenskaper som exempelbilden. Detta gjorde det möjligt för modellen att generalisera från en enda hundbild, till det "allmänna konceptet med en hund, "och plocka snabbt ut andra hundar som det inte hade sett förut, förklarar Zhang.

    Forskarna testade hur effektiv den nya datorns visuella sökmodell var genom att mäta antalet gånger datorn fick fixera på olika platser i en scen innan de hittade sitt mål. "Det som förvånar oss är att genom att använda vår metod, datorer kan söka bilder lika snabbt som människor, även när man letar efter föremål som de aldrig har sett förut, "säger Zhang. Datorn var till och med lika bra som människor på att hitta Waldo.

    Teamet programmerar nu sin modell med en bättre förståelse av sammanhanget. Till exempel, människor förstår naturligtvis att en kopp är mer sannolikt att sitta på ett bord än att flyta i luften. När det väl implementerats, detta borde förbättra modellens effektivitet ytterligare, säger Zhang, lägga till, "Waldo kan inte gömma sig längre."


    © Vetenskap https://sv.scienceaq.com