• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • PizzaGAN får bilden på hur man gör en pizza

    Är inget heligt? Vem skulle våga ens prata om ett maskininlärningsexperiment som resulterar i den perfekta (flämtande) pizzan? Det är svårt att tänka, men en forskningskvintett ryckte inte för att försöka, och de arbetade med att lära en maskin hur man gör en stor paj.

    Säg hej till PizzaGAN, en kompositionslagerbaserad generativ modell som syftade till att spegla steg-för-steg-proceduren för pizzatillverkning.

    Deras mål var att lära maskinen genom att bygga en generativ modell som speglar en ordnad uppsättning instruktioner. Hur de gick till:"Varje operatör är utformad som ett Generative Adversarial Network (GAN). Med tanke på endast svag bildnivåövervakning, operatörerna utbildas för att generera ett visuellt lager som måste läggas till eller tas bort från den befintliga bilden. Den föreslagna modellen kan sönderdela en bild till en ordnad lagersekvens genom att applicera motsvarande borttagningsmoduler sekventiellt i rätt ordning. "

    (Generativa kontradiktoriska nätverk kan göra många saker, Victoria Song noterade i Gizmodo . Hon sa att det var "i princip den typ av maskininlärning som används för att generera realistiska AI -ansikten och deepfakes.")

    Resultat? Det räcker med att de rapporterade att de gjorde en modell till deras belåtenhet. "Experimentella resultat på syntetiska och riktiga pizzabilder visar att vår föreslagna modell kan:(1) segmentera pizzatoppar på ett svagt övervakat sätt, (2) ta bort dem genom att avslöja vad som är inneslutet under dem (dvs. målning), och (3) dra slutsatsen att beställningen av pålägget sker utan övervakning av djupet. "

    Teamet pratade om sina syntetiska och riktiga pizzadata.

    "Pizza är den mest fotograferade maten på Instagram med över 38 miljoner inlägg med hashtaggen #pizza, "sa de. De laddade ner en halv miljon bilder från Instagram med hjälp av flera populära pizzarelaterade hashtags. De filtrerade bort oönskade bilder med hjälp av en CNN-baserad klassificerare utbildad på en uppsättning manuellt märkta pizza/icke-pizzabilder.

    De samlar in etiketter på bildnivå för pizzatopparna på Amazon Mechanical Turk (AMT) för 9, 213 pizzabilder.

    För deras syntetiska pizza -dataset, de använde pizzabilder i clipart-stil. "Det finns två huvudsakliga fördelar med att skapa en dataset med syntetiska pizzor. För det första det tillåter oss att generera en godtyckligt stor uppsättning pizzaexempel med noll mänsklig annoteringskostnad. För det andra och ännu viktigare, vi har tillgång till exakt grundsanningsbeställningsinformation och flerskiktad pixelsegmentering av påfyllningarna. "

    Så, i den större bilden, vilket bidrag har de gjort, om någon, till mänskligheten? Victoria Song gjorde en poäng, när hon skrev, "I det långa loppet, man kan tänka sig ett neuralt nätverk som kan skanna ett foto och spotta ut ett ganska exakt recept baserat på ingredienser, hur grundligt det är kokt, och till och med knappt synliga kryddor. "

    När allt är sagt (och gjort), "forskningen visar mestadels en AI:s förmåga att skilja mellan en förvirrande hög med ingredienser." De visste detta när de satte sig för att fokusera på pizza. Tänk "arketypiskt exempel" på något som behöver sekventiell tillsats av ingredienser i en specifik ordning.

    I den större bilden, pizza är inte det enda objektet som kan använda deras tillvägagångssätt. "Även om vi bara har utvärderat vår modell i samband med pizza, vi tror att ett liknande tillvägagångssätt är lovande för andra typer av livsmedel som är naturligt skiktade, till exempel hamburgare, smörgåsar, och sallader. "

    För mer information om deras forskning, deras papper heter "Hur man gör en pizza:Lär dig en kompositionslagerbaserad GAN-modell, "av Dim Papadopoulos, Youssef Tamaazousti, Ferda Ofli, Ingmar Weber och Antonio Torralba. Papperet finns på arXiv. Tidningen lämnades in tidigare denna månad.

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com