Oggi sentiamo parlare spesso di algoritmi basati sull’AI che vengono definiti Text-To-Image, e sono in grado di generare immagini di qualità a partire da un testo. I più noti sono DALL·E 2 di OpenAI, DALL·E mini, Imagen e Muse di Google, Midjourney, BlueWillow e AI Stable Diffusion.
DALL·E 2 è un modello di linguaggio generativo che trasforma delle semplici frasi in immagini, è in grado di modificare e ritoccare in modo realistico le foto oltre a creare varianti di un’immagine partendo da una originale.
Imagen è un modello Text To Image di Google con un grado di fotorealismo senza precedenti e un profondo livello di comprensione del linguaggio.
Muse è il nuovo modello Text to Image di Google che sembra avere le performance più elevate in assoluto, con un efficientamento anche del processo di generazione.
Midjourney è un laboratorio di ricerca indipendente incentrato su design, infrastrutture umane e intelligenza artificiale, ed anche il nome di un nuovo generatore Text-To-Image molto efficace.
BlueWillow è un’alternativa gratuita a Midjourney, la qualità è inferiore ma è comunque elevata.
Stable Diffusion è il modello generativo Text to Imagine della startup Stability AI, che sta creando una serie di tool gratuiti basati sull’AI.
DALL·E mini è un tentativo di riprodurre gli impressionanti risultati di DALL·E attraverso un modello open-source.
TikTok ha integrato un Text-To-Image nell’applicazione mobile, si tratta del filtro “AI greenscreen”, che genera un’immagine partendo da un prompt testuale, che successivamente può essere usata come sfondo per i video dei creator.
Scarabocchi trasformati in opere d’arte, opere d’arte create da algoritmi, ad ognuno il proprio pensiero su cosa potrà riservarci il futuro…
Gianluca Giordani