AI kan producera prisbelönt konst, men det kan fortfarande inte konkurrera med mänsklig kreativitet

Olika konstverk av robotar, ritade av AI. Bild skapad av författaren (med stabil diffusion). Författare tillhandahålls

Människor anser att kreativitet är mänskligt. Artificiell intelligens (AI) har dock nått det stadie där den också kan vara kreativ.

En nyligen genomförd tävling väckte ilska från konstnärer efter att den delade ut ett pris till ett konstverk skapat av en AI-modell känd som Midjourney. Och sådan mjukvara är nu fritt tillgänglig tack vare lanseringen av en liknande modell som heter Stable Diffusion, som är den mest effektiva i sitt slag hittills.

Fackföreningar av kreativa utövare som Stop AI Stealing the Show har under en tid väckt oro över användningen av AI inom kreativa områden. Men kan AI faktiskt ersätta mänskliga artister?

Dessa nya AI-modeller kan skapa oändliga möjligheter. Varje bild av robotarna som visas ovan är unika, men genereras av stabil spridning från liknande användarförfrågningar.

Det finns två sätt att använda dessa AI-artister:skriv en kort textuppmaning eller tillhandahåll en bild bredvid uppmaningen för att ge mer vägledning. Från en uppmaning på 14 ord kunde jag generera flera logotyper för ett påhittat företag som levererar frukt. På knappt 20 minuter. På min bärbara dator i mellanklassen.

En design för ett företag med färsk frukt som levererar snabbt, Logotyp, High Contrast, Polyvinyl – uppmaningen som jag använde för att få Stable Diffusion att göra dessa bilder.

Som du kan se av resultaten ovan kämpar Stable Diffusion för att skapa konst som involverar ord. Och en del av frukterna är lite funky.

Ändå finns det inget sätt att jag kunde ha producerat något sådant här på distans utan att använda AI eller anlita hjälp av en grafisk designer. Jag kunde inte ha skapat robotbilderna själv heller.

Potentialen med denna teknik har inte gått obemärkt förbi – startupen som ansvarar för Stable Diffusion, Stability AI, siktar på en investeringsutvärdering på 1 miljard USD (900 miljoner pund). Men dessa AI-modeller börjar få ett genomslag i den verkliga världen, som man kan se med den prisbelönta Midjourney-bilden. Där AI verkligen utmärker sig är att producera konstverk som kombinerar olika element och stilar.

Men även om AI kan göra det mesta av benarbetet åt dig, kräver användningen av dessa modeller fortfarande skicklighet. Ibland genererar en prompt inte riktigt den bild du ville ha. Eller så kan AI:n användas tillsammans med andra verktyg och utgör bara en liten del av en större pipeline.

Och att skapa konst är annorlunda än att producera digital design. Stable Diffusion är bättre på att rita landskap än logotyper.

Varför Stable Diffusion är en game changer

AI-modeller är vanligtvis tränade för att skapa konst med hjälp av en datauppsättning som innehåller häpnadsväckande 5,85 miljarder bilder. Denna enorma mängd data behövs så att AI kan lära sig om bildinnehåll och konstnärliga koncept. Och det tar väldigt lång tid att bearbeta.

För Stable Diffusion tog det 150 000 timmar (drygt 17 år) processortid. Detta kan dock reduceras till mindre än en månads realtid genom att träna parallellt på stora datorkluster (samlingar av kraftfulla datorer som fungerar som en enda enhet).

Stability AI tillhandahåller också ett onlineverktyg som heter DreamStudio som låter dig använda dess AI-modell till en kostnad av cirka 0,01 USD per bild. I jämförelse, för att använda konkurrenten OpenAI:s konstmodell, DALL·E 2, är kostnaden över tio gånger så stor.

AI-konstmodeller kämpar fortfarande för att rita händer korrekt. Bild skapad av författaren med hjälp av Stable Diffusion.

Båda metoderna använder samma underliggande tillvägagångssätt, känt som ett diffusionsmodell datorprogram, som lär sig att skapa nya bilder genom att titta på massor av befintliga bilder. Men stabil diffusion har en lägre beräkningskostnad, vilket innebär att det kräver mindre tid att träna och använder mindre energi.

Dessutom kan du faktiskt inte ladda ner och köra OpenAIs modell själv, bara interagera med den via en webbplats. Stable Diffusion är ett projekt med öppen källkod som alla kan leka med. Så det åtnjuter fördelen av snabb utveckling av onlinekodningsgemenskapen, såsom förbättringar av modellerna, användarguider, integration med andra verktyg. Detta har redan hänt under veckorna efter att Stable Diffusion släpptes i augusti 2022.

Konstens framtid?

Även om stora förbättringar har gjorts under de senaste fem åren, finns det fortfarande saker som AI-konstmodeller kämpar med. Ord i deras konstverk är igenkännliga men ofta skrattretande. På samma sätt kämpar AI för att återge mänskliga händer.

Det finns också den uppenbara begränsningen att dessa modeller bara kan producera digital konst. De kan inte arbeta med oljor eller pasteller som människor kan. På det sätt som vinyl har gjort comeback kan tekniken initialt skapa en svängning mot en ny form, men med tiden verkar folk alltid cirkulera tillbaka till den ursprungliga formen med högsta kvalitet.

I slutändan, som tidigare forskning har funnit, är AI-modeller i sin nuvarande form mer benägna att fungera som nya verktyg för konstnärer än som digitala ersättningar för kreativa människor. Till exempel kan AI:n generera en rad bilder för att fungera som utgångspunkt, som sedan kan väljas från och förbättras av en mänsklig konstnär.

Detta kombinerar styrkorna hos AI-konstmodeller (snabb iteration och skapande av bilder) med styrkorna hos mänskliga konstnärer (en vision för konstverket och att övervinna problemen med AI-modeller). Detta gäller särskilt i fallet med beställd konst när en specifik produktion behövs. AI på egen hand är osannolikt att producera det du behöver.

Det finns dock fortfarande en fara för kreativa. Digitala artister som väljer att inte använda AI kan bli lämnade, oförmögna att hänga med i den snabba iterationen och lägre kostnader för AI-förbättrade artister. + Utforska vidare