• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Återställa balansen i datamängder för maskininlärning

    Fem representativa prover för varje klass (rad) i CIFAR-10-datauppsättningen. För varje klass, dessa prover erhålls med generativa modeller tränade efter att 40 % av bilderna från den specifika klassen tappats från träningsuppsättningen. Kredit:IBM

    Om du vill lära ett barn hur en elefant ser ut, du har ett oändligt antal alternativ. Ta ett foto från National Geographic, ett uppstoppat djur av Dumbo, eller en elefant nyckelring; visa det för barnet; och nästa gång han ser ett föremål som ser ut som en elefant kommer han sannolikt att peka och säga ordet.

    Att lära AI hur en elefant ser ut är lite annorlunda. För att träna en maskininlärningsalgoritm, du kommer sannolikt att behöva tusentals elefantbilder med olika perspektiv, såsom huvud, svans, och profil. Men då, även efter att ha tagit in tusentals foton, om du ansluter din algoritm till en kamera och visar den en rosa elefantnyckelring, den kommer förmodligen inte att känna igen den som en elefant.

    Detta är en form av datafördom, och det påverkar ofta negativt noggrannheten hos klassificerare för djupinlärning. För att fixa denna fördom, med samma exempel, vi skulle behöva minst 50-100 bilder av rosa elefanter, vilket kan vara problematiskt eftersom rosa elefanter är "sällsynta".

    Detta är en känd utmaning i maskininlärningssamhällen, och om det är rosa elefanter eller vägmärken, små datamängder innebär stora utmaningar för AI-forskare.

    Återställa balansen för utbildning av AI

    Sedan tidigare i år, mina kollegor och jag på IBM Research i Zürich erbjuder en lösning. Det heter BAGAN, eller balansera generativa kontradiktoriska nätverk, och det kan generera helt nya bilder, dvs av rosa elefanter, för att återställa balansen för träning av AI.

    Fem representativa prover genererade för de tre mest representerade majoritetsklasserna i GT-SRB-datasetet. Kredit:IBM

    Se är att tro

    I tidningen rapporterar vi att vi använder BAGAN på det tyska riktmärket för identifiering av trafikmärken, samt på MNIST och CIFAR-10, och jämfört med toppmoderna GAN, metodiken överträffar dem alla när det gäller variation och kvalitet på de genererade bilderna när träningsdataset är obalanserat. I tur och ordning, detta leder till en högre noggrannhet hos slutklassificerare som tränats på den utökade datamängden.

    Fem representativa prov genererade för de tre minst representerade minoritetsklasserna i GT-SRB-datauppsättningen. Kredit:IBM

    Den här historien återpubliceras med tillstånd av IBM Research. Läs originalberättelsen här.




    © Vetenskap https://sv.scienceaq.com