Innehållsförteckning för Vad är stabil diffusion och hur fungerar det?..:
- Vad är stabil diffusion?
- Steg för steg-guide Stabil diffusion
- Fördelar och nackdelar med AI-bildgeneratorn Stable Diffusion
- Användning av Ki-genererat innehåll
- Alternativ till stabil diffusion?
- Stabil Diffusion vs. AI Midjourney
- Slutsats
- VANLIGA FRÅGOR
Vad är stabil diffusion?
Stable Diffusion är en AI-bildgenerator som genererar digitala bilder baserat på prompts, dvs. instruktioner i textform. Applikationen har utvecklats av Stability AI, en Londonbaserad startup som har funnits sedan 2020. Runway ML, EleutherAI, det tyska företaget LAION och en forskargrupp från LMU München bidrog till företagets AI-bildgenerator. Den första versionen av verktyget kom ut i augusti 2022.
Det är en programvara med öppen källkod. Det innebär att användarna kan bygga vidare på den befintliga koden och vidareutveckla den. Det hela bygger på ett deep learning-system, dvs. ett djupt neuralt nätverk som består av flera lager som gör det möjligt att känna igen och "lära sig" komplexa mönster och samband i datamängder. I det här verktyget möts bildigenkänning och taligenkänning: Den artificiella intelligensen känner igen de röstkommandon som användaren anger och söker fram de element som matchar dem i en befintlig bilddatabas.
AI:n tränades med ett extremt stort antal bilder, som var och en gavs en matchande term och utsattes för en latent diffusionsmodellprocess. Diffusion innebär att man från ett mönster (punkter eller pixlar) skapar en bild och att det motsvarande programmet känner igen de angivna aspekterna av bilden. De flera miljoner bilderna kom från LAION Aesthetics-datasetet. AI kan bara använda befintliga källor för att generera "nya" bilder.
Steg för steg-guide Stabil diffusion
Stable Diffusion kan nås på flera sätt. Alternativ 1: Öppna Stability AI:s webbplats och klicka på verktyget "Dream Studio". Alternativ 2: Öppna Hugging Face Hub via plattformen. Alternativ 3: Ladda ner programvaran till din egen enhet.
Steg 1:
Öppna webbplatsen Stability AI.
Steg 2:
Scrolla ner tills du ser knappen "Dream Studio". Klicka på den.
Steg 3:
På sidan som öppnas letar du efter knappen "Kom igång" (kan också vara markerad som "Prova mig nu" eller "Prova gratis"). Klicka på den.
Steg 4:
Registrera dig med din e-postadress i den inmatningsmask som nu öppnas.
Steg 5:
Du kommer att få ett bekräftelsemeddelande. Använd länken i e-postmeddelandet för att komma åt Dream Studios front-end-applikation.
Steg 6:
Du kommer återigen att se en inmatningsmask. Ange din uppmaning, dvs. textkommandot, i det textfält som visas.
Viktigt att veta: Kvaliteten på uppmaningen är direkt relaterad till kvaliteten på resultatet. Ju mer exakt du formulerar dig, desto mer exakt blir resultatet. Eftersom inte alla är begåvade ingenjörer har Stability AI publicerat en promptguide.
Med Stable Diffusion får du de bästa resultaten med engelskspråkiga instruktioner. Verktyget kan även fungera med tyska instruktioner. Men det bygger på en mycket större databas på engelska. Instruktionerna bör vara så detaljerade som möjligt. Nyckelord förstås bättre än fraser.
När du har angett din uppmaning ger verktyget dig fyra bildvarianter. Du kan använda dessa varianter för att fortsätta arbeta med den.
Fördelar och nackdelar med AI-bildgeneratorn Stable Diffusion
Först och främst låter det relativt enkelt att skapa användbara bilder med det här verktyget. Och det är det också. Du bör ha hyfsade kunskaper i engelska och kunna beskriva vad du förväntar dig av verktyget. På så sätt kan du generera bildmaterial i tillräcklig upplösning gratis och med en hanterbar tidsåtgång.
Men det är också här som problemen börjar: 3D-materialet är användbart och upplösningen är bra. Det är inte enastående material, och upplösningen är inte enastående. Ju mer specifika resultat du vill ha, desto mer tidskrävande blir det att generera materialet. Vid en viss punkt är tidsåtgången inte längre hanterbar. Och så har vi fortfarande problemet med att Stable Diffusion bara kan arbeta med det bildmaterial som LAIONs AI har matats med. Det är alltså inte möjligt att skapa något helt nytt.
De största fördelarna är att verktyget är gratis att använda och intuitivt att använda.
Upphovsrätt för Ki-genererat innehåll
Hur är det med upphovsrätt och nyttjanderätt? Först och främst varierar lagstiftningen i de olika länder där verktyget är tillgängligt. Det finns ingen enhetlig reglering. Och sedan finns det en övergripande tvist om vem som äger rättigheterna till AI-genererat innehåll. Det finns goda argument för att upphovsrätten tillhör de personer som programmerat AI:n. Innehållet skulle ju inte kunna skapas utan dessa personer. Men lika logiskt är det att upphovsrätten ligger hos dem som genom att mata in anpassade uppmaningar har fått AI:n att skapa just detta innehåll. Denna fråga är alltså inte slutgiltigt avgjord. Det är också oklart vem som kan hållas ansvarig för problematiskt innehåll.
Med tanke på detta är det helt förståeligt att företag är mycket tveksamma till att använda AI-genererat innehåll. Rättigheterna att använda konstnärligt och kreativt innehåll kan ju bara beviljas av den som har upphovsrätten. Och det är, som redan nämnts, inte självklart. I vilket fall som helst bör de tillämpliga villkoren kontrolleras noggrant innan innehållet används i någon utsträckning.
Alternativ till stabil diffusion?
Det finns faktiskt några AI-bildgeneratorer som du kan prova som ett alternativ. Artbreeder är en av dem, DeepAI och DALL-E är andra möjligheter. Craiyon, NightCafe och Visionist är också mer eller mindre lämpliga för att generera bildmaterial. Den förmodligen mest kända representanten bland AI-bildgeneratorerna är dock AI Midjourney.
Stabil Diffusion vs. AI Midjourney
Det första som är slående är: Stable Diffusion är gratis att använda och upplösningen är tillräckligt bra jämfört med AI Midjourney (högre än DALL-E). Snabbheten och implementeringen av prompterna är tillfredsställande, och bildkvaliteten är jämförbar. Det är dock slående att man via Dream Studio har direkt tillgång till inmatningsmasken och resultaten från Stability AI:s AI-verktyg. AI Midjourney används för närvarande (sommaren 2023) fortfarande via Discord. Discord måste installeras, du behöver ett användarkonto, ofta nog är dataöverföringen överbelastad. Sedan väntar du länge på att dina uppmaningar ska behandlas, även för relativt enkla uppgifter, vilket är irriterande.
Den andra punkten är integritet. Med AI Midjourney tillhör inte det bildinnehåll som genereras dig. AI Midjourney förbehåller sig rätten att visa ditt genererade material som exempel i galleriet. Det innebär att 3D-bilderna är tillgängliga för alla som är intresserade och som kan arbeta vidare med dem. Om du vill generera mer än en handfull bilder och använda dem kommersiellt behöver du ett abonnemang. Även sekretess kostar.
Slutsats
Att skapa bilder med hjälp av AI har blivit mycket enklare under de senaste två åren. Tekniken gör enorma framsteg. De facto ligger utvecklingen av verktygen före opinionsbildningen i samhället - vi vet helt enkelt inte idag hur vi juridiskt och moraliskt ska hantera detta visuella material. Det visuella materialet är inte kurerat, vilket är anledningen till att det kan finnas stötande material. Du kan inte förvänta dig unika bilder som är skräddarsydda för din ansökan här. Du kan inte ens förvänta dig felfria bilder, eftersom hästar med fem ben och liknande misstag händer hela tiden. Du bör inte heller förvänta dig mångfald när det gäller hudfärg, nationalitet, språk etc. Det är här algoritmisk bias kommer in i bilden.
Om resultatet fortfarande är tillräckligt för dig, finns det inget som talar emot att använda Stable Diffusion eller ett jämförbart verktyg. AI-bildgeneratorer kommer inte att försvinna igen, utan kommer att hitta och behålla sin plats i de kreativa branscherna. Så det är dags att ta itu med dem - tekniskt, ur etnisk synvinkel, ur användarens perspektiv och ur juridisk synvinkel.