Det har hänt mycket på kort tid inom generativ AI-teknik. I den här guiden kommer vi att fokusera på de verktyg som kan skapa AI-bilder utifrån dina instruktioner, så kallade prompts. Till vår hjälp har vi AI-kreatören och art director Annika Bäckström, som driver instagramkontot annikan.ai.

– Det är nyttigt att testa sig fram med de här verktygen, säger hon som ett första tips till publicister.
För redaktionella aktörer kan det finnas flera skäl till att använda sig av AI-bildverktyg:
- För att bildsätta eller illustrera en artikel.
- För att ta fram koncept och underlag inför till exempel en omgörning av tidningen.
- Eller för att dra in på kostnader för bildinköp.
Bildbyråerna ses ofta som de stora förlorarna i och med alla nya AI-bildverktyg. Varför köpa en bild av en stol när man bara kan be ett AI-verktyg skapa en sådan bild?
Tre tips: Så kan du använda AI-verktyg
Här följer tre tips om hur du som publicist kan ha användning av olika AI-verktyg:
1. Skapa bilder
Text-till-bild-verktyg som Midjourney, Adobe Firefly, Stable Diffusion och Dall-E genererar nya bilder från din textprompt. Du kan skapa bilder i olika stilar, färger, tekniker osv. Allt från extremt surrealistiskt till fototekniskt exakt. I till exempel Midjourney kan du också blanda (blend) två bilder för att skapa en ny. I till exempel Adobe Firefly kan du först skapa en bild och sedan plussa på annat generativt innehåll.
2. Redigera bilder
Bildredigeringsprogrammet Photoshop har fått flera nya och förfinade funktioner med stöd av Adobe Fireflys generativa AI-teknik. Du kan till exempel lägga till och ta bort innehåll i en bild, eller utöka bildytan med nytt genererat innehåll. Det har aldrig varit enklare att frilägga en person från bakgrunden, eller att skapa en helt ny bakgrund till ett motiv.
3. Skala upp bilder
AI-genererade bilder kan inte bli hur stora (högupplösta) som helst. I till exempel Midjourney är maxmåttet 2048 pixlar gånger 2048 pixlar. Vill du trycka en AI-bild behöver du spara om den i ett större format. För detta finns flera olika verktyg. AI-kreatören Annika Bäckström rekommenderar Topaz Labs uppskalningsverktyg.

Illustration: Annika Bäckström
Osäker upphovsrätt
AI-tekniken ger en mängd nya möjligheter. Men i vissa avseenden är det inte lämpligt för tidningsmakare att använda sig av den. AI-bilder kan inte ersätta dokumentära fotografier. Skulle publicister använda AI-bilder för att visa nyhetsförlopp skulle det säkerligen undergräva förtroendet för tidningens journalistik.
Aftonbladet har varit tidigt ute på det här området och tagit fram en AI-bildpolicy där det framgår att AI-generade bilder inte ska användas för att illustrera nyheter. I policyn står också att det tydligt ska framgå i bildtexten om en bild i tidningen är AI-genererad.
För publicister är en viss försiktighet med den nya tekniken att föredra och det kan finnas följande skäl till att inte använda AI-bild-verktyg:
- Det går inte att dokumentärt illustrera en verklig händelse, person eller förlopp med en AI-bild.
- Det finns etiska och upphovsrättsliga tveksamheter kring den data som AI-modellerna tränats på.
- Det kan vara förvirrande för läsarna om vissa bilder är ”riktiga” och andra är AI-skapade.
De upphovsrättsliga osäkerheterna med generativ AI går att dela upp i:
* output, det vill säga bilderna de skapar, och
* input, det vill säga den stora mängd data som verktygen har tränats på.
Flera konstnärer har kritiserat – och stämt – stora AI-bildverktyg för att de menar att AI-verktyg tränats på deras bilder. Upphovsrätten är något som publicister generellt värnar högt, och för publicister blir följdfrågan: går det att värna den egna upphovsrätten och samtidigt använda sig av verktyg som kritiseras för att utnyttja andras?
Detta är något som tidskrifter och tidningar behöver ta ställning till. Det gäller också att skaffa sig kännedom om de olika verktygens träningsbas, vilket den här guiden kommer att hjälpa dig med.
– AI-modellerna har tränats på att förstå hur saker och ting ser ut. Som exempel kan de behöva ”läsa av” 3 000 bilder på en stol för att de ska lära sig hur en stol ser ut. Men de här algoritmerna sparar inga bilder som de har tränats på, utan man kan tänka sig att det funkar mer som en maskin som bilderna bara skjutsas igenom, säger Annika Bäckström.
Fyra stora AI-bildverktyg
Här guidar vi dig till de största AI-generativa bildverktygen. Än så länge är det Adobe Firefly som visat framfötterna när det gäller etik och upphovsrätt. Verktyget finns i gratisversion och än viktigare: Adobe hävdar att deras bild-till-text-verktyg är ”etiskt tränat”. Fireflys träningsdata består av Adobes byråbilder, Adobe Stock, och ”öppet licensierat material och public domain-innehåll där upphovsrätten gått ut”.
Adobe Firefly
Släpptes: 2023
Drivs av: Adobe Inc., ett multinationellt mjukvaruföretag med huvudkontor i Kalifornien i USA. Bland annat skapare av Photoshop och Indesign.
Tränad på: Etiskt tränad på ”open licensed content” och stockbilder från Adobe Stock.
Vem äger bilden? Enligt Adobe beror det på lokal lagstiftning, det vill säga oklart.
Stil: Bildbankskänsla.
Pris: Finns en pristrappa. Från gratisversion till betalmodeller för privatpersoner eller företag. Ju dyrare desto fler generativa credits, vilket i sin tur ger en sorts prioritering när bilder ska processas av Firefly. Firefly är en del av Adobes paket Adobe Creative Cloud, som även innehåller bland annat programmen Photoshop, Illustrator, Premiere Pro och så vidare. Kostar betydligt mer. Funktioner från Firefly finns integrerade i program som till exempel Photoshop och Illustrator.
Övrigt: Ska enligt Adobe Firefly vara ”säker för kommersiell användning”.
Midjourney
Släpptes: 2022
Drivs av: Midjourney Inc., ett oberoende forskningslabb med bas i San Francisco i USA.
Tränad på: Midjourney-vd:n David Holz sade 2022 till Forbes att träningsbasen: bara är ”en stor skrapning av Internet” och att Midjourney inte sökt tillåtelse av upphovsmännen för att använda bilderna.
Vem äger bilden? Enligt Midjourneys ”terms of service” äger plattformen alla prompts och bilder som skapas i Midjourney, men du har som användare rätt att använda bilder du skapat hur du vill. Flera Midjourney-konstnärer har dock fått avslag när de försökt registrera copyright för sina AI-bilder via det amerikanska US Copyright Office. En kvinnlig illustratör fick till exempel upphovsrätt för texten och formgivningen av sin bok, men inte för bilderna som hon skapat i Midjourney, eftersom ”de inte är en produkt av mänskligt upphovsmannaskap.”
Rättsliga tvister: Tre artister har stämt företagen bakom AI-bildtjänsterna Midjourney (Midjourney Inc.), Stable Diffusion (Stability AI) och Dream Up (DiviantArt) för upphovsrättsintrång. En domare i California avslog i oktober deras talan mot Midjourney och DiviantArt.
Stil: ”Det mest estetiska AI-bildverktyget”, enligt Annika Bäckström.
Pris: Finns en pristrappa. Från 10 dollar i månaden till 120 dollar i månaden. I de dyrare paketen har man möjlighet att anpassa hur snabbt bilden tas fram.
Övrigt: Midjourney är, än så länge, bara åtkomlig via communitytjänsten Discord.
Stable Diffusion
Släpptes: 2022
Drivs av: Stability AI, ett företag med huvudkontor i London i Storbritannien, som gör generativa AI-modeller.
Tränad på: LAION 5B, en gigantisk datamängd insamlad på nätet i forskningssyfte av den tyska ideella föreningen LAION.
Vem äger bilden? Stable Diffusion är ett open source-verktyg. Enligt Stable Diffusion saknar bilderna copyright och är så kallad ”public domain”, det vill säga fria för vem som helst att använda. Men en upphovsman bakom en bild skapad i Stable Diffusion har faktiskt fått upphovsrätt för sin bild. Den kinesiska domen är unik och det första utfallet där en upphovsperson fått upphovsrätt för en AI-bild. Mannen kunde bevisa för domstolen att han med samma prompt, seedvärde (ett sorts ursprungsvärde till bilden), inställningar och justeringar kunde återskapa sin bild.
Rättsliga tvister: Bildbyrån Getty Images har i Storbritannien stämt Stability AI för att olovligen ha använt deras bilder för att träna AI. Bland annat har förvrängda vattenstämplar från Getty synts på bilder från Stable Diffusion.
En tysk fotograf har stämt organisationen LAION för upphovsrättsintrång. En domstol i Hamburg har fått fallet på sitt bord. Målet ska tas upp under våren, och kan bli det första avgörandet inom EU gällande frågan om AI-träning.
Stil: Inga regler. Vill du göra pornografiskt innehåll är det här verkstaden. Lyckligtvis går det att välja bort den typen av bilder.
Pris: Finns en pristrappa. Från gratisversion till betalmodeller som kostar som mest 20 dollar i månaden. Bilder skapade i betalvarianterna får användas för kommersiellt bruk. Gratismodellen ger bara två bilder åt gången och det går att generera som mest 10 bilder per dag utan kostnad.
Dall-E
Släpptes: 2021
Drivs av: Open AI, ett amerikansk AI-forskningsföretag med huvudkontor i San Francisco, som är mest känt för sitt AI-textverktyg ChatGPT – och nu senast för hajpade text-till-video-verktyget Sora.
Tränad på: En kombination av ”publika källor och källor som vi har licensierat”. Men det är lite oklart exakt vilka de publika källorna är och om det även skett otillåten användning vid träningen.
Vem äger bilden? Open AI överlåter ägandet till användaren, men OpenAI kan använda innehåll för att till exempel tillhandahålla, utveckla och förbättra sina tjänster.
Stil: Bildbankskänsla.
Rättsliga tvister: Tidningen The New York Times har stämt OpenAI och Microsoft (som investerat i OpenAI) för upphovsrättsintrång.
Komikern Sarah Silverman har, tillsammans med två andra författare, stämt OpenAI och Meta för upphovsrättsintrång gällande OpenAI och Metas stora språkmodeller ChatGPT, respektive LLaMA.
Ytterligare stämningar gällande upphovsrättsintrång har kommit in från författare mot OpenAI.
Pris: En pristrappa per bild utifrån vilken version av Dall-E du vill jobba med, samt vilken storlek på bilderna du behöver. Från 1,60 cent per bild till 4 cent per bild.
Övrigt: Microsofts Bing Image Creator bygger på Dall-E. Dall-E 3 är integrerad i ChatGPT Plus och ChatGPT Enterprise.
Källor: Wikipedia, The Verge, CNBC, Reuters, The Official Microsoft blog, Annika Bäckström, Open AI, Dall-E, Midjourney, Midjourney Inc, Stability AI, Stabel Diffusion, LAION, Adobe Firefly, Adobe
Text: Matilda Nilsson
Foto: Emily Dahl, Anette Persson och skärmdump
Illustrationer: Annika Bäckström
Liten AI-ordlista (med fokus på bilder)
AI: Artificiell intelligens (AI) är ett samlingsnamn för en rad olika teknologier som försöker få datorprogram att fungera mer likt en människa.
Generativ AI: En form av artificiell intelligens som kan användas för att generera innehåll, det vill säga att skapa till exempel text, ljud och bild utifrån den data som verktyget har tränats på.
Syntetisk media: All media, det vill säga bild, ljud, rörligt eller text, som är skapat med hjälp av generativ AI.
Syntografi: Ett ”fotografi” som är skapat med generativ AI i stället för med en kamera.
Prompt: En instruktion till ett AI-verktyg. När det gäller bildverktyg kan prompten vara rätt kortfattad och mest likna en lista med nyckelord (keywords).
Prompta: Att skriva en instruktion till ett AI-verktyg.
Negativa prompts: Att skriva vad bilden inte ska innehålla.
Prompt crafter/Prompt craft engineers: En ny yrkeskategori, personer som använder generativ AI för att skapa bilder, illustrationer, konst, videor, musik etc.
Rerolla: Köra samma prompt igen.
Seed: Engelska för frö. Ett seed är den blurriga bild som AI-modellerna utgår från när de skapar generativa bilder. Varje seed har ett visst värde, ett seedvärde, som i viss mån påverkar bildens utförande. Vill man ha samma känsla på en serie av bilder kan ett tips vara att prova att utgå från ett fixerat seedvärde.
Opt out: Att begära att ens innehåll, till exempel journalistik eller dokumentära foton, inte används för att träna AI-modeller. Finns ingen helt säker teknisk lösning för hur detta ska fungera.
Algoritm bias/Bias: När datasystem, till exempel bild-AI-modeller, reproducerar fördomar i sitt resultat.
Inspiration!
Tre printtidningar fyllda med AI-bilder.
Midjourney Magazine
Text-till-bild verktyget Midjourney gör ett månadsmagasin uteslutande i print (ja, du läste rätt). I papperstidningen Midjourney Magazine finns bilder skapade i Midjourney, kompletta med prompten bakom. Bara att härma!
COPY Magazine
Den svensktillverkade printtidningen har kallats världens första AI-modemagasin. Första numret innehåller över 450 bilder promptade av art director Carl-Axel Wahlström. Läs mer om affärsmodellen bakom COPY här – och ta del av Carl-Axels bästa prompt-tips.
Biblioteksbladet nr 4, 2023
Biblioteksföreningens tidning lät AI-konstnären Annika Nordenskiöld skapa AI-bilder till nästan hela tidningen. Traditionell organisationspress möter modern AI-teknik. I en ledare berättar chefredaktör Thord Eriksson om varför han valde att göra hela tidningen illustrerad med AI-bilder: ”i höstas fick jag syn på boken From Nothing” (av Annika Nordenskiöld). ”Det går inte att avfärda resultatet som själlöst pynt, jag hävdar bestämt att det är konst.”
Fortsätt läsa fler artiklar i vår stora guide om AI-bilder