Indholdsfortegnelse for Hvad er stabil diffusion, og hvordan fungerer det?..:
- Hvad er stabil diffusion?
- Trin for trin-guide til stabil diffusion
- Fordele og ulemper ved AI-billedgeneratoren Stable Diffusion
- Brug af Ki-genereret indhold
- Alternativer til stabil diffusion?
- Stabil diffusion vs. AI midt i rejsen
- Konklusion
- OFTE STILLEDE SPØRGSMÅL
Hvad er stabil diffusion?
Stable Diffusion er en AI-billedgenerator, der genererer digitale billeder baseret på prompts, dvs. instruktioner i tekstform. Applikationen er udviklet af Stability AI, en London-baseret start-up, der har eksisteret siden 2020. Runway ML, EleutherAI, den tyske virksomhed LAION og en forskningsgruppe fra LMU München har bidraget til virksomhedens AI-billedgenerator. Den første version af værktøjet udkom i august 2022.
Det er open source-software. Det betyder, at brugerne kan bygge videre på den eksisterende kode og udvikle den yderligere. Det hele er baseret på et deep learning-system, dvs. et dybt neuralt netværk bestående af flere lag, som gør det muligt at genkende og "lære" komplekse mønstre og relationer i datasæt. I dette værktøj mødes billedgenkendelse og talegenkendelse: Den kunstige intelligens genkender de stemmekommandoer, som brugerne indtaster, og søger efter de elementer, der matcher dem, i en eksisterende billeddatabase.
Den kunstige intelligens blev trænet med et ekstremt stort antal billeder, som hver især fik et matchende udtryk og blev udsat for en latent diffusionsmodelproces. Diffusion betyder, at der ud fra et mønster (punkter eller pixels) skabes et billede, og at det tilhørende program genkender de specificerede aspekter af billedet. De flere millioner billeder kom fra LAION Aesthetics-datasættet. Den kunstige intelligens kan kun trække på eksisterende kilder for at generere "nye" billeder.
Trin for trin-guide til stabil diffusion
Stable Diffusion kan tilgås på flere måder. Mulighed 1: Åbn Stability AI's hjemmeside, og klik på værktøjet "Dream Studio". Mulighed 2: Åbn Hugging Face Hub via platformen. Mulighed 3: Download softwaren til din egen enhed.
Trin 1:
Åbn hjemmesiden for Stability AI.
Trin 2:
Rul ned, indtil du ser knappen "Dream Studio". Klik på den.
Trin 3:
På den side, der åbnes, skal du kigge efter knappen "Kom i gang" (kan også være markeret som "Prøv mig nu" eller "Prøv gratis"). Klik på den.
Trin 4:
Registrer dig med din e-mailadresse i den indtastningsmaske, der nu skulle åbne sig.
Trin 5:
Du vil modtage en bekræftelsesmail. Brug linket i e-mailen til at få adgang til Dream Studios' front-end-applikation.
Trin 6:
Du vil igen se en inputmaske. Indtast din prompt, dvs. tekstkommandoen, i det dertil beregnede tekstfelt.
Vigtigt at vide: Kvaliteten af prompten er direkte relateret til kvaliteten af resultatet. Jo mere præcist du formulerer dig, jo mere præcist et output får du. Da ikke alle er begavede prompt-ingeniører, har Stability AI udgivet en prompt-guide.
Med Stable Diffusion opnår du de bedste resultater med engelsksprogede vejledninger. Værktøjet kan også arbejde med tyske instruktioner. Men det trækker på en meget større database på engelsk. Prompterne skal være så detaljerede som muligt. Nøgleord forstås bedre end sætninger.
Når du har indtastet din prompt, giver værktøjet dig fire billedvarianter. Du kan bruge disse varianter til at arbejde videre med det.
Fordele og ulemper ved AI-billedgeneratoren Stable Diffusion
Først og fremmest lyder det relativt nemt at generere brugbare billeder med dette værktøj. Og det er det også. Du bør beherske det engelske sprog nogenlunde og være i stand til at beskrive, hvad du forventer af værktøjet. På den måde kan du generere billedmateriale i tilstrækkelig opløsning gratis og inden for et overskueligt tidsrum.
Men det er også her, problemerne begynder: 3D-optagelserne er brugbare, og opløsningen er god. Det er ikke fremragende optagelser, og opløsningen er ikke fremragende. Jo mere specifikke dine resultater skal være, jo mere tidskrævende bliver det at generere materialet. På et tidspunkt er tidsforbruget ikke længere håndterbart. Og så er der stadig problemet med, at Stable Diffusion kun kan arbejde med det billedmateriale, som LAIONs AI er blevet fodret med. Så det er ikke muligt at skabe noget helt nyt.
De største fordele er den gratis brug og den intuitive betjening af værktøjet.
Ophavsret til Ki-genereret indhold
Hvad med ophavsret og brugsrettigheder? Først og fremmest varierer lovgivningen i de forskellige lande, hvor værktøjet er tilgængeligt. Der er ingen ensartet regulering. Og så er der en overordnet strid om, hvem der ejer rettighederne til AI-genereret indhold. Der er gode argumenter for, at ophavsretten tilhører dem, der har programmeret den kunstige intelligens. Når alt kommer til alt, kunne indholdet ikke skabes uden disse mennesker. Men lige så logisk er det, at ophavsretten ligger hos dem, der via input af skræddersyede prompts har fået AI'en til at skabe netop dette indhold. Så dette spørgsmål er ikke endeligt afgjort. Det er også uklart, hvem der kan holdes ansvarlig i tilfælde af problematisk indhold.
På den baggrund er det helt forståeligt, at virksomheder er meget tøvende med at bruge AI-genereret indhold. Når alt kommer til alt, kan rettighederne til at bruge kunstnerisk og kreativt indhold kun gives af dem, der har ophavsretten. Og det er, som allerede nævnt, ikke klart. Under alle omstændigheder bør de gældende vilkår og betingelser kontrolleres grundigt, før indholdet bruges i et hvilket som helst omfang.
Alternativer til stabil diffusion?
Der er faktisk nogle AI-billedgeneratorer, du kan prøve som et alternativ. Artbreeder er en af dem, DeepAI og DALL-E er andre muligheder. Craiyon, NightCafe og Visionist er også mere eller mindre velegnede til at generere billedmateriale. Den nok mest kendte repræsentant blandt AI-billedgeneratorerne er dog AI Midjourney.
Stabil diffusion vs. AI midt i rejsen
Det første slående punkt er: Stable Diffusion er gratis at bruge, og opløsningen er god nok sammenlignet med AI Midjourney (højere end DALL-E). Hastigheden og implementeringen af prompterne er tilfredsstillende, og billedkvaliteten er sammenlignelig. Det er dog påfaldende, at man via Dream Studio har direkte adgang til inputmasken og resultaterne af Stability AI's AI-værktøj. AI Midjourney bruges i øjeblikket (sommer 2023) stadig via Discord. Discord skal installeres, du skal have en brugerkonto, og dataoverførslen er ofte overbelastet. Derefter venter du længe på, at dine prompts bliver behandlet, selv for relativt enkle opgaver, hvilket er irriterende.
Det andet punkt er privatlivets fred. Med AI Midjourney tilhører det genererede billedindhold ikke dig. AI Midjourney forbeholder sig ret til at vise dit genererede materiale som et eksempel i galleriet. Det betyder, at 3D-billederne er tilgængelige for alle, der er interesserede, og som kan arbejde videre med dem. Hvis du vil generere mere end en håndfuld billeder og bruge dem kommercielt, skal du have et abonnement. Privatliv koster også.
Konklusion
Det er blevet meget lettere at generere billeder via AI i løbet af de sidste to år. Teknologien gør enorme fremskridt. De facto er udviklingen af værktøjerne forud for meningsdannelsen i samfundet - vi ved simpelthen ikke i dag, hvordan vi juridisk og moralsk skal håndtere dette visuelle materiale. Det visuelle materiale er ikke kurateret, hvilket er grunden til, at der kan være stødende materiale. Du kan ikke forvente unikke billeder, der er skræddersyet til din applikation her. Du kan ikke engang forvente fejlfrit billedmateriale, for heste med fem ben og lignende brølere sker hele tiden. Du skal heller ikke forvente mangfoldighed med hensyn til hudfarver, nationaliteter, sprog osv. Det er her, algoritmisk bias kommer ind i billedet.
Hvis resultatet stadig er tilstrækkeligt for dig, er der intet, der taler imod at bruge Stable Diffusion eller et tilsvarende værktøj. AI-billedgeneratorer vil ikke forsvinde igen, men vil finde og fastholde deres plads i de kreative brancher. Så det er på tide at få styr på dem - teknisk, fra et etnisk synspunkt, fra et brugerperspektiv og fra et juridisk synspunkt.