fbpx

L’arte grafica delle intelligenze artificiali

Ormai da diversi anni si parla in modo sempre più insistente di intelligenza artificiale e di come questa stia contribuendo a cambiare la nostra società. L’intelligenza artificiale è la branca dell’informatica che tratta le reti neurali (modelli computazionali ispirati al cervello biologico) e le relative tecniche di apprendimento (machine/deep learning). È probabile che conosciate già tali espressioni tecniche poiché esse riguardano tecnologie attualmente in uso nei comuni smartphone/tablet e laptop, sia a livello software, sia hardware. Non stiamo dunque parlando di uno scenario di fantascienza, ma semplicemente dei giorni nostri. Una rivoluzione avvenuta finora sottotraccia, quasi silenziosamente. Avrete infatti notato come le foto degli smartphone siano diventate nel tempo sempre più belle, tanto da contribuire al crollo del mercato delle fotocamere digitali reflex/mirrorless. Ciò non è dipeso soltanto dall’impiego di ottiche e sensori migliori, o dai famosi megapixel, ma anche e soprattutto dall’incredibile lavoro effettuato dagli algoritmi d’intelligenza artificiale che oggi governano le app fotografiche. Oltre a ciò vi sarà anche capitato di affidarvi a degli assistenti virtuali per delle ricerche sul web o per ottenere dei consigli sulla risoluzione di vari problemi. E poi… non trovate che il traduttore di Google sia diventato molto più bravo?

In informatica le rivoluzioni comportano quasi sempre un aumento vertiginoso della richiesta di potenza di calcolo e poco importa se inizialmente si rende necessario l’uso di hardware costoso che necessita enormi quantità di energia, poiché nel giro di pochi anni si passa alla produzione di processori altamente specializzati e di minor consumo destinati ad arricchire l’architettura dei comuni dispositivi informatici general purpose. Ed eccoci dunque arrivati alle NPU (Neural Processing Unit) o acceleratore AI, dei microprocessori che si occupano di eseguire l’enorme quantità di calcoli necessari agli algoritmi che fanno uso del machine learning, ossia quel sottoinsieme di tecnologie dell’intelligenza artificiale che svolgono in modo prevalentemente autonomo vari tipi di compiti tra cui l’elaborazione delle immagini citata in precedenza. Quindi se da un lato capiamo che l’intelligenza artificiale è oggi diffusa praticamente ovunque, dall’altro ci rendiamo conto che essa è utilizzata per compiere dei lavori ben precisi dove conta innanzitutto l’efficienza, cioè tutte cose che non riguardano né concorrono con altri aspetti legati all’intelligenza umana, tra cui la coscienza, il dubbio, la creatività. Abbiamo principalmente delle reti neurali che tramite dei metodi di apprendimento migliorano la conoscenza di un problema e la capacità di risolverlo. Se temevate che qualche device casalingo o portatile stesse progettando di uccidervi potete anche tranquillizzarvi, non hanno (ancora) la potenza di calcolo necessaria e continueranno a occuparsi unicamente dei lavori per i quali sono stati progettati. Discorso diverso è invece quello che riguarda alcune AI che oggi operano online, a noi accessibili tramite app che fungono da interfaccia, dotate di capacità che le rendono più simili a noi umani.

Qui entriamo in un campo molto affascinante, ma che inevitabilmente spinge a interrogarsi anche su delle questioni di natura etica. In questo articolo non ci occuperemo di argomenti spinosi come l’eventuale autocoscienza delle AI in grado di apparire umane dialogando con gli umani, ma affronteremo la capacità delle AI di generare arte visiva partendo dalla comprensione del linguaggio umano. Caratteristica questa che sta suscitando un fortissimo interesse e scatenando dei dibattiti molto accesi specie tra chi opera nel settore della grafica digitale.

La capacità di creare arte visiva, ad esempio la pittura, è da sempre qualcosa che distingue l’uomo da ogni altra forma di vita sul pianeta. Eppure, dai tempi dei primi dipinti rupestri a oggi, è accaduto qualcosa di nuovo e proprio in questo periodo storico: è stata create dell’arte e non per mano dell’uomo, ma grazie ai neuroni dell’intelligenza artificiale. Una di queste opere ha persino sbaragliato la concorrenza umana vincendo un concorso online, eccola qui:

Bisogna dire che già negli anni 80/90 gli home/personal computer resero possibile la creazione di particolari opere astratte a cui qualcuno provò anche ad attribuire un valore artistico, queste erano note come immagini frattali. Nel tempo questo tipo di algoritmi si è largamente diffuso nei software grafici 2D/3D, alimentando una vena creativa ancora oggi viva.

Tuttavia in questo caso siamo di fronte a una mera rappresentazione grafica di principi matematici neanche troppo complessi, trovate QUI un approfondimento sulla storia e gli utilizzi della geometria frattale.

Il tipo di arte digitale generativa di cui intendo occuparmi si basa invece su principi più complessi e per tanto richiede una potenza di calcolo molto elevata. Nonostante ciò il modo per sperimentare con queste AI è il più banale che esista, occorre semplicemente descrivere l’immagine con un testo più o meno complesso (prompt) e a quel punto dei sistemi informatici ben più potenti del vostro pc daranno vita a un processo creativo stupefacente. Potrete rendervi conto di cosa si sta parlando grazie al video molto divertente creato da un’artista che è anche un noto content creator su youtube:

Se intendete cimentarvi o curiosare con questi sistemi sappiate che al momento esistono tre principali intelligenze artificiali:

OpenAI (DALL-E)
Midjourney
Stable Diffusion

Io consiglio di iniziare a sperimentare subito un’altra AI, Dream by Wombo, utilizzabile gratuitamente e illimitatamente dal browser del pc o tramite app dedicata. Basterà partire da una qualsiasi descrizione testuale in lingua inglese (va bene anche una traduzione di google) oppure da un’immagine con o senza descrizione testuale aggiuntiva. Inoltre è possibile scegliere da un numero enorme di stili differenti predefiniti. L’immagine di apertura di questo articolo è stata creata proprio con questa intelligenza artificiale. Di seguito altre immagini da me ottenute con questa ottima app:

OpenAI è un’organizzazione non profit nata allo scopo di far evolvere le AI in modo non minaccioso per l’umanità, un approccio per certi versi simile alle leggi della robotica ideate dal grande autore di fantascienza Isaac Asimov. Dall-E 2 è l’applicazione di arte generativa creata da OpenAI. Occorre solo registrarsi al sito e iniziare a utilizzare i 50 crediti gratuiti (successivamente ne verranno erogati 15 al mese). Esauriti i crediti gratuiti sarà possibile acquistarne altri. Dall-E è da molti considerato il più efficiente modello di deep learning attualmente disponibile per la generazione di arte grafica. Tramite esso sono riuscito a ottenere senza alcun sforzo delle immagini abbastanza fotorealistiche, ecco alcuni esempi:

Ad ogni elaborazione  Dall-E presenta quattro diverse interpretazioni della vostra descrizione, selezionando quella più vicina all’idea di partenza è possibile avviare un processo di affinamento (al costo di un credito per elaborazione)

La caratteristica più interessante offerta da Dall-E (ma anche da altri sistemi simili) è quella di poter caricare un’immagine e fare in modo che l’AI generi in una qualsiasi area al suo interno l’elemento descritto tramite testo. Il più delle volte la parte grafica generata dall’AI andrà a inserirsi in modo credibile e coerente con l’immagine originale, rispettando illuminazione e prospettiva. Per quel che mi riguarda questo è proprio il tipo di strumento che vorrei venisse implementato in Photoshop o altri software di fotoritocco.

Midjourney è attualmente accessibile solo tramite l’app Discord (avrete a disposizione una prova gratuita più successivi piani a pagamento) ed è a mio parere quella con cui si ottengono i risultati più sbalorditivi, provate a dare un’occhiata a questa galleria o al gruppo facebook ufficiale. C’è da restare a bocca aperta. Io che sperimento con la grafica digitale fin da ragazzino, cioè da circa trent’anni, francamente non ricordo un’esplosione di creatività come quella che sto osservando in questo periodo. Qualcosa di vagamente paragonabile (con le dovute proporzioni) risale all’iniziale diffusione della grafica 3D, tecnica che per tutti gli anni ’90 (e anche qualcosa oltre) ha faticato a essere riconosciuta come arte.

Sicuramente molti di voi  a questo punto obietteranno qualcosa del genere:

“Ok, ma questi presunti AI Artists non usano dei software grafici, poiché essi dialogano con un’intelligenza artificiale la quale in pochi istanti restituirà il proprio lavoro”.

Si, questa è un’affermazione che non può essere smentita in quanto è esattamente ciò che accade (anche se le immagini create dalle AI spesso vengono successivamente ritoccate con photoshop o software analoghi). Inoltre c’è anche un’ulteriore questione: a chi apparterrà realmente questo lavoro? Secondo alcuni, ad esempio, le immagini restituite dalle AI sono solo dei remix di ciò che da anni tutti noi riversiamo sul web spesso incautamente per quel che riguarda privacy e diritti d’autore (motivazione per cui oggi è possibile ricorrere agli NFT). Al momento non sono in grado di dare una risposta a certe domande e di dire chi abbia ragione nel dibattito tra pro e contro (sebbene io propenda per il pro). La mia impressione è che i cosiddetti Ai Artists siano come dei ‘minatori’ che riescono (alcuni meglio di altri, con più inventiva e creatività) ad estrarre immagini da una riserva potenzialmente inesauribile. Immagini che nella maggioranza dei casi appaiono realmente come nuove oltre che estremamente ispirate.

Chiaramente io non direi mai a un giovane interessato alla computer grafica: “lascia perdere photoshop, butta la fotocamera mirrorless, non imparare blender/maya/zbrush perché tanto faranno tutto le intelligenze artificiali.” Consiglierei semplicemente di non perdere di vista l’evoluzione di questa nuova realtà e di impiegarla a piacimento in una o più fasi del proprio flusso di lavoro, il quale solitamente passa per l’uso di più software oltre che dalla ricerca di risorse e immagini reference sul web.

Proviamo allora a capire, sebbene in modo estremamente semplificato, come funzionano queste intelligenze artificiali. Prendiamo ad esempio il modello dell’AI Stable Diffusion che è l’unico ad essere open source. Tutto è iniziato quando alcuni ricercatori informatici si sono posti il problema di come rimuovere il rumore digitale dalle foto. Se prendiamo una foto ben definita e in una serie di passaggi applichiamo ad essa un rumore/disturbo (gaussiano) crescente, questa ovviamente finirà presto per diventare irriconoscibile. Eppure delle AI sono state addestrate a compiere il processo inverso, cosa che le rende capaci di restituire delle immagini nitide partendo da un insieme di pixel apparentemente caotico.

Dopodiché combinando questa capacità a quella di riconoscere cosa un’immagine rappresenta e quindi di darne una descrizione semantica, si mette in condizione l’AI di poter creare immagini nuove partendo da una descrizione testuale (o anche grafica). Un processo vagamente simile a quando proviamo a focalizzare in mente un’immagine non ben definita o a ricordare un sogno poco nitido. La cosa importante da tenere presente è che l’addestramento di queste AI avviene analizzando un numero elevatissimo di immagini, prevalentemente prese tra quelle disponibili online, con in gioco un’enorme potenza di calcolo.

Torniamo all’uso pratico e immediato di Stable Diffusion. Essendo io appassionato di street photography e amando l’immaginario cyberpunk, oltre che gli anni 80, ho provato a combinare questi soggetti in un’estetica synthwave:

Avrei potuto ottenere dozzine o anche centinaia di immagini del genere (quelle che vedete sono state ritoccate in una rapida fase di post-produzione): di esse ho apprezzato molto la composizione, una qualità che da fotografi è possibile ottenere non solo con la pratica, ma soprattutto studiando le opere di fotografi esperti e/o celebri, cioè ‘addestrandosi’ in un modo non dissimile da come lo sono le intelligenze artificiali. Il codice del modello di Stable Diffusion è disponibile a qualunque programmatore, questo rende tale AI particolarmente interessante poiché iniziano a fioccare plugin che la integrano ad applicazioni open source e non. Ciò significa che il software grafico ‘tradizionale’ è destinato a ospitare degli strumenti AI creativi molto più potenti di quelli finora utilizzati per aumentare la definizione e il dettaglio delle immagini digitali.

Anche Adobe pare stia iniziando ad aprire al text-to-image, ma ha deciso di andarci piano per far si che gli strumenti basati sull’intelligenza artificiale siano in futuro dei “copiloti creativi” e non dei capitani, visione devo dire molto ragionevole.