Ett originalfoto (vänster); samma foto beskuren av befintlig teknik, t.ex. programvaran i smartphones; och samma foto beskuren av forskarnas modell för att innehålla den visuellt betydande delen av fotot. Upphovsman:James Wang och Jia Li / Penn State
Datorer kan nu automatiskt beskära foton för att fånga den mest intressanta delen på ett estetiskt tilltalande sätt, tack till forskare vid Penn State.
"När manuellt beskär en bild, människor identifierar den mest intressanta eller iögonfallande delen av fotot-även om det är centrerat-och beskär fotot för att rama in det, men befintliga verktyg beskär foton i mitten av bilden, utan att överväga om avsnittet innehåller en visuellt betydande del av fotot, "sa Jia Li, professor i statistik, WHO, tillsammans med sin kollega James Wang, professor i informationsvetenskap och teknik, fick nyligen amerikanskt patent nr 10, 186, 040 för modellen. "Vi har löst detta problem genom att skapa en statistisk modell som snabbt identifierar den visuella betydelsen av varje segmenterad del av ett foto och beskär det övergripande fotot på ett estetiskt tilltalande sätt."
Enligt forskarna, programvaran kan användas i smartphones, på sociala medier och på webbläsare, där foton traditionellt har beskurits automatiskt i mitten, saknar ofta huvudämnet eller ger ett estetiskt obehagligt resultat.
Teamet modellerade den tid som ett mänskligt öga sannolikt kommer att dröja kvar på ett visst segment av en bild med hjälp av en Markov -kedja, som är en statistisk modell. Uppmärksamheten på alla segment beror på dess individuella attribut som färg, textur och ljusstyrka, liksom dess rumsliga relation till andra segment. Forskarna kodade alla dessa olika typer av information inom parametrarna i Markov -kedjan. Den statistiska modellen rankar sedan segmenten, med den högsta betydelsen som tilldelas segmentet som håller ögat längst. Denna beställning hjälper modellen att bestämma den bästa platsen att beskära. Beslutet tar också hänsyn till den beskurna bildens estetiska kvalitet.
"Rumslig ordning av segmenten i en bild spelar en stor roll för att bestämma betydelse, "sa Li." Modellen överväger hur segmenten interagerar rumsligt, utan att anta att bildens geometriska centrum nödvändigtvis är viktigare. Till exempel, två segment med samma utseende kan ha ganska olika betydelsepoäng beroende på deras placering i förhållande till resten av bilden. "
Enligt Li och Wang, modellen fungerar snabbt för att beskära foton och kräver mycket liten datorkraft.
"Vår kod tar cirka 50 millisekunder att bearbeta en bild på 400 x 300 pixlar på en vanlig stationär dator eller bärbar dator, "sa Wang." Som ett resultat, vår metod är lämplig för enheter med begränsat minne och datorkraft. "
Teamet hoppas kunna marknadsföra sin metod till sökmotorer och mobiltelefonföretag på internet, bland andra.
"Genom att beskära foton på ett mer estetiskt tilltalande sätt, ett antal fotorelaterade applikationer kan förbättras, särskilt när skärmstorleken är liten, som i telefoner, klockor eller surfplattor, "sa Wang." Dessutom, modellen kan hjälpa företag med visuella annonser att förbättra sina klickfrekvenser. "