Indice dei contenuti di Cos'è la diffusione stabile e come funziona?
- Che cos'è la diffusione stabile?
- Guida passo passo alla diffusione stabile
- Vantaggi e svantaggi del generatore di immagini AI Diffusione stabile
- Utilizzo di contenuti generati da Ki
- Alternative alla diffusione stabile?
- Diffusione stabile vs. IA a metà percorso
- Conclusione
- FAQ
Che cos'è la diffusione stabile?
Stable Diffusion è un generatore di immagini AI che genera immagini digitali sulla base di prompt, ossia istruzioni in forma di testo. L'applicazione è stata sviluppata da Stability AI, una start-up con sede a Londra che esiste dal 2020. Runway ML, EleutherAI, l'azienda tedesca LAION e un gruppo di ricerca della LMU di Monaco hanno contribuito al generatore di immagini AI dell'azienda. La prima versione dello strumento è stata presentata nell'agosto 2022.
È un software open source. Ciò significa che gli utenti possono basarsi sul codice esistente e svilupparlo ulteriormente. Il tutto si basa su un sistema di deep learning, ovvero una rete neurale profonda composta da diversi strati che permettono di riconoscere e "imparare" modelli e relazioni complesse negli insiemi di dati. In questo strumento, il riconoscimento delle immagini e il riconoscimento vocale si fondono: L'intelligenza artificiale riconosce i comandi vocali immessi dagli utenti e cerca gli elementi che vi corrispondono in un database di immagini esistente.
L'intelligenza artificiale è stata addestrata con un numero estremamente elevato di immagini, a ciascuna delle quali è stato assegnato un termine di corrispondenza e sottoposta a un processo di modello di diffusione latente. Diffusione significa che, partendo da un modello (punti o pixel), viene creata un'immagine e il programma corrispondente riconosce gli aspetti specificati dell'immagine. I diversi milioni di immagini provengono dal set di dati LAION Aesthetics. L'intelligenza artificiale può attingere solo a fonti esistenti per generare "nuove" immagini.
Guida passo passo alla diffusione stabile
È possibile accedere a Stable Diffusion in diversi modi. Opzione 1: aprire il sito web di Stability AI e fare clic sullo strumento "Dream Studio". Opzione 2: aprire Hugging Face Hub tramite la piattaforma. Opzione 3: scaricare il software sul proprio dispositivo.
Fase 1:
Aprire il sito web di Stability AI.
Fase 2:
Scorrere verso il basso fino a visualizzare il pulsante "Dream Studio". Fare clic su di esso.
Passo 3:
Nella pagina che si apre, cercate il pulsante "Inizia" (che può anche essere indicato come "Provami ora" o "Prova gratis"). Fare clic su di esso.
Passo 4:
Registratevi con il vostro indirizzo e-mail nella maschera di immissione che si aprirà.
Passo 5:
Riceverete un'e-mail di conferma. Utilizzate il link contenuto nell'e-mail per accedere all'applicazione front-end di Dream Studios.
Passo 6:
Verrà nuovamente visualizzata una maschera di immissione. Inserite il prompt, ovvero il comando di testo, nel campo di testo previsto.
Importante da sapere: La qualità della richiesta è direttamente correlata alla qualità del risultato. Più precisa è la formulazione, più preciso sarà il risultato. Dato che non tutti sono dei tecnici esperti di prompt, Stability AI ha pubblicato una guida ai prompt.
Con Stable Diffusion si ottengono i migliori risultati con le istruzioni in lingua inglese. Lo strumento può funzionare anche con istruzioni in tedesco. Tuttavia, si basa su un database molto più ampio in lingua inglese. Le istruzioni devono essere il più possibile dettagliate. Le parole chiave sono più comprensibili delle frasi.
Una volta inserita la richiesta, lo strumento fornisce quattro varianti di immagine. È possibile utilizzare queste varianti per continuare a lavorare con lo strumento.
Vantaggi e svantaggi del generatore di immagini AI Diffusione stabile
Innanzitutto, sembra relativamente facile generare immagini utilizzabili con questo strumento. Ed è così. È necessario avere una padronanza abbastanza fluente della lingua inglese ed essere in grado di descrivere ciò che ci si aspetta dallo strumento. In questo modo, è possibile generare materiale di immagini con una risoluzione sufficiente, gratuitamente e in un tempo gestibile.
Ma è anche qui che iniziano i problemi: Le riprese in 3D sono utilizzabili e la risoluzione è buona. Non si tratta di filmati eccezionali e la risoluzione non è eccezionale. Più si vogliono ottenere risultati specifici, più la generazione del materiale richiede tempo. A un certo punto, il tempo richiesto non è più gestibile. E poi c'è ancora il problema che Stable Diffusion può lavorare solo con il materiale dell'immagine con cui è stata alimentata l'AI di LAION. Non è quindi possibile creare qualcosa di completamente nuovo.
I maggiori vantaggi sono la gratuità e l'intuitività dello strumento.
Copyright dei contenuti generati da Ki
E per quanto riguarda il copyright e i diritti d'uso? Innanzitutto, la legislazione varia nei diversi Paesi in cui lo strumento è accessibile. Non esiste una normativa uniforme. E poi c'è una disputa generale su chi detiene i diritti sui contenuti generati dall'IA. Ci sono buoni argomenti per sostenere che il copyright appartiene alle persone che hanno programmato l'IA. Dopo tutto, il contenuto non potrebbe essere creato senza queste persone. Ma è altrettanto logicamente comprensibile la posizione secondo cui i diritti d'autore spettano a coloro che, attraverso l'inserimento di suggerimenti personalizzati, hanno indotto l'IA a creare proprio questi contenuti. Pertanto, la questione non è stata risolta in modo definitivo. Inoltre, non è chiaro chi possa essere ritenuto responsabile in caso di contenuti problematici.
Alla luce di ciò, è del tutto comprensibile che le aziende esitino a utilizzare i contenuti generati dall'intelligenza artificiale. Dopo tutto, i diritti di utilizzo di contenuti artistici e creativi possono essere concessi solo da chi detiene il copyright. E questo, come già detto, non è chiaro. In ogni caso, i termini e le condizioni applicabili dovrebbero essere verificati a fondo prima di utilizzare i contenuti in qualsiasi misura.
Alternative alla diffusione stabile?
Esistono effettivamente alcuni generatori di immagini AI che si possono provare come alternativa. Artbreeder è uno di questi, DeepAI e DALL-E sono altre possibilità. Anche Craiyon, NightCafe e Visionist sono più o meno adatti a generare materiale di immagini. Probabilmente il rappresentante più noto tra i generatori di immagini AI è AI Midjourney.
Diffusione stabile vs. IA a metà percorso
Il primo punto che colpisce è che Stable Diffusion è gratuito e la risoluzione è abbastanza buona rispetto a AI Midjourney (superiore a DALL-E). La velocità e l'implementazione dei prompt sono soddisfacenti e la qualità dell'immagine è paragonabile. Tuttavia, colpisce il fatto che si abbia accesso diretto alla maschera di input e ai risultati dello strumento AI di Stability AI tramite Dream Studio. AI Midjourney è attualmente (estate 2023) ancora utilizzato tramite Discord. Discord deve essere installato, è necessario un account utente e spesso il trasferimento dei dati è sovraccarico. Poi si attende a lungo che le richieste vengano elaborate, anche per compiti relativamente semplici, il che è fastidioso.
Il secondo punto è la privacy. Con AI Midjourney, il contenuto delle immagini generate non vi appartiene. AI Midjourney si riserva il diritto di mostrare il materiale generato come esempio nella galleria. Ciò significa che le immagini 3D sono accessibili a chiunque sia interessato e possa continuare a lavorarci. Se si desidera generare più di una manciata di immagini e utilizzarle a fini commerciali, è necessario un abbonamento. Anche la privacy ha un costo.
Conclusione
La generazione di immagini tramite l'IA è diventata molto più semplice negli ultimi due anni. La tecnologia sta facendo enormi progressi. Di fatto, lo sviluppo degli strumenti è in anticipo rispetto alla formazione dell'opinione nella società: semplicemente oggi non sappiamo come trattare legalmente e moralmente questo materiale visivo. Il materiale visivo non è curato, ed è per questo che può essere offensivo. Non ci si può aspettare immagini uniche e personalizzate per la propria applicazione. Non ci si può nemmeno aspettare immagini impeccabili, perché i cavalli a cinque zampe e altri errori simili accadono di continuo. Non ci si deve nemmeno aspettare una diversità in termini di colori della pelle, nazionalità, lingue, ecc.
Se il risultato è ancora sufficiente, non c'è nulla da eccepire sull'uso di Stable Diffusion o di uno strumento analogo. I generatori di immagini AI non scompariranno di nuovo, ma troveranno e manterranno il loro posto nelle industrie creative. È quindi giunto il momento di imparare a conoscerli: tecnicamente, dal punto di vista etnico, dal punto di vista dell'utente e dal punto di vista legale.