fbpx

L’intelligenza artificiale generativa progredisce a ritmo sostenuto

La prima metà del 2023 è stata segnata da una rivoluzione informatica senza precedenti. Oggi abbiamo a disposizione, gratuitamente o a pagamento, sistemi di intelligenza artificiale in grado di sostenere qualsiasi tipo di dialogo con gli esseri umani e di aiutarli (fino a sostituirli) in tutti quei lavori che richiedono conoscenza e creatività. Non si è trattato di un hype passeggero, né di una ‘bolla’, come molti pensavano o forse speravano. Non è un sogno (per alcuni un incubo). È la realtà. Se a inizio anno avevamo come riferimento il lancio di ChatGPT e la diffusione della versione 4 di Midjourney, ossia un’istantanea dello stato dell’arte di questa tecnologia, ora abbiamo il successivo modello GPT-4 e le versioni 5.x di Midjourney che ci consentono di capire quale sia la reale velocità di evoluzione dell’intelligenza artificiale generativa.
Partiamo dal recente GPT-4 di OpenAI. Inutile cercare numeri ad effetto che possano quantificare la maggiore potenza (circolano cifre senza senso) poiché basta dare un’occhiata ai vari test presentati da OpenAI dove risulta evidente che l’ultima evoluzione del loro modello linguistico surclassa il precedente in ogni campo.
Il dato più significativo per comprendere l’evoluzione di questa intelligenza artificiale risiede in realtà nell’enorme investimento e coinvolgimento di Microsoft nel progetto. OpenAI ora può utilizzare i supercomputer di Microsoft (dal valore di centinaia di milioni di dollari) per addestrare ed evolvere la propria IA in una dimensione molto diversa da quella dove i ricercatori e programmatori hanno lavorato negli anni scorsi. Microsoft ha persino rilanciato annunciando la realizzazione di sistemi ancora più potenti e costosi basati su tecnologia Nvidia (altro colosso profondamente impegnato nel campo delle intelligenze artificiali). L’azienda di Redmond ha deciso di buttarsi a capofitto in questo settore e di cambiare ancora una volta e per sempre la storia dell’informatica. Una naturale conseguenza di ciò è l’ingresso dell’IA in tutti i principali strumenti di produttività di Microsoft: Office più il Designer.

Quest’ultima evoluzione del Designer a molti è parso un guanto di sfida ad Adobe, la quale ha finalmente rotto gli indugi presentando Firefly, un insieme di modelli creativi basati su un’intelligenza artificiale generativa proprietaria. Non poteva mancare il text to image che attualmente spopola tra tutti gli estimatori dell’arte grafica generata dalle IA:

Tornando a Microsoft, nell’ultimo keynote (fine maggio), sono stati tantissimi gli annunci riguardante l’intelligenza artificiale, e se in precedenza Satya Nadella (Presidente e CEO di Microsoft) aveva dichiarato:

“La giornata di oggi segna il prossimo grande passo nell’evoluzione del modo in cui interagiamo con l’informatica, che cambierà radicalmente il modo in cui lavoriamo e sbloccherà una nuova ondata di crescita della produttività”

Ora ha aggiunto: “L’IA sta spingendo l’era del computer dalla bicicletta alla locomotiva a vapore.”

Ecco altre dichiarazioni:

“L’AI generativa è la nuova evoluzione della creatività e produttività guidate dall’AI, in grado di trasformare la conversazione tra creativo e computer in qualcosa di più naturale, intuitivo e potente. Con Firefly, Adobe porterà gli ‘ingredienti creativi’ potenziati dall’AI generativa direttamente nei flussi di lavoro degli utenti, aumentando la produttività e la consapevolezza di tutti i creatori, dai professionisti high-end fino alla base della creator economy.”
 David Wadhwani, Digital Media Business Adobe

Sam Altaman CEO di OpenAI guarda ancora più avanti e pensa all’avvento dell’AGI, Artificial General Intelligence, nota anche come intelligenza artificiale forte, qualcosa che possegga capacità superiori o molto superiori a quelle degli esseri umani. E con gli investimenti multimiliardari messi in campo da Microsoft, oltre a delle infrastrutture progettate proprio per lo sviluppo delle IA, tale obiettivo potrebbe non essere lontano: “Man mano che i nostri sistemi si avvicinano all’AGI, stiamo diventando sempre più cauti con la creazione e l’implementazione dei nostri modelli”. Saranno davvero cauti, o la forte competizione in atto li porterà ad accelerare sempre più?

Ecco anche un estratto di un lungo post pubblicato da Bill Gates: “Lo sviluppo dell’intelligenza artificiale è fondamentale quanto la creazione del microprocessore, del personal computer, di Internet e del telefono cellulare. Cambierà il modo in cui le persone lavorano, imparano, viaggiano, ottengono assistenza sanitaria e comunicano tra loro. Intere industrie si riorienteranno intorno ad esso. Le aziende si distingueranno per quanto bene lo usano”. Dal post di Bill Gates apprendiamo inoltre che egli ha incontrato i ricercatori di OpenAI già nel 2016… poteva non esserci il suo zampino in una simile rivoluzione?

Dopo un lungo periodo di rincorsa, Google è arrivata finalmente a svelare le proprie carte. Sembra che nell’ultimo keynote, l’abbreviazione “AI” sia stata pronunciata più di 150 volte.

Colossi come Meta e Amazon sono ancora assenti all’appello, ma hanno annunciato l’intenzione di arricchire i loro prodotti con l’intelligenza artificiale.

Non possiamo prevedere il futuro, ma certamente alcune cose appaiono abbastanza chiare. L’evoluzione delle IA generative è molto rapida e questo articolo potrebbe diventare obsoleto già nel giro di poche settimane. Faccio un piccolo esempio: su questo sito è possibile leggere l’opera sperimentale intitolata: “L’ultimo romanzo cyberpunk“, due racconti di fantascienza realizzati utilizzando ChatGPT (GPT-3.5). Considerando l’interesse suscitato da tale esperimento, ho atteso che ChatGPT tornasse attivo in Italia dopo lo stop imposto dal Garante della Privacy, per poter finalmente utilizzare la versione Plus e il modello GPT-4. Grazie alla notevole potenza di questo strumento, ho creato non solo un nuovo racconto più complesso (circa 15.000 parole, 100.000 caratteri), ma anche una guida intitolata “Scrittura creativa con ChatGPT”. Questo materiale verrà pubblicato il 31 maggio 2023.

Prima di dare un’occhiata alle ultime novità di Midjourney, desidero affrontare il tema e soprattutto la domanda che oggi in molti si pongono, vale a dire: questi prodotti rivoluzionari e innovativi presentati da  Microsoft e Adobe (ma ne esistono anche di altri) sostituiranno l’essere umano nel campo del Graphic Design, della Fotografia, della Computer Grafica… ma anche nel Giornalismo, nella Scrittura e nello Sviluppo Software? Secondo il mio umile parere, assolutamente sì. Di certo non tutti, ma in moltissimi dovranno cambiare lavoro. Il modo di progettare qualsiasi prodotto digitale che includa testo, codice, grafica, audio e video è destinato ad essere stravolto nel giro di mesi, piuttosto che anni. Chi sarà in grado di adattarsi a questo cambiamento vedrà evolvere il proprio flusso di lavoro, guadagnando in produttività, mentre gli altri potranno al massimo ritagliarsi una nicchia creando una sorta di “artigianato digitale”. Tra l’altro credo che in molti stiano sottovalutando la creatività mostrata da questi modelli di intelligenza artificiale, auto-convincendosi che essi sono limitati a una mera imitazione delle immagini e dei testi con cui sono state addestrate, e che di conseguenza non saranno mai in grado di spingersi ‘oltre’. Niente di più falso. Basta utilizzare uno strumento come midjourney, mantenendosi non troppo esaustivi nella definizione del prompt, per vedere comparire immagini che spesso interpretano la nostra richiesta con molta creatività. Inoltre, centinaia di migliaia di utenti sperimentano ogni giorno nuove combinazioni di stili e soggetti diversi, ottenendo spesso delle immagini che francamente non credo siano mai state neanche pensate prima dell’avvento di tali strumenti.

Infine abbiamo una particolare categoria di grafici che attualmente se ne sta in disparte a fare finta di niente, come se tutto ciò non fosse destinato a travolgere anche loro, e mi riferisco agli artisti 3D.  Negli ultimi trent’anni ho seguito sia sul piano teorico, sia su quello pratico, l’evoluzione della computer grafica 3D, ambito in cui attualmente individuo alcuni punti di forza o di resistenza. Ma considerata l’evoluzione a cui stiamo assistendo, credo che gli artisti 3D debbano prendere in seria considerazione l’idea che queste roccaforti cadranno nel giro di mesi o al massimo di qualche anno. Infatti ho intenzione di continuare a mantenere ed aggiornare la mia guida introduttiva a Blender 3D, iniziando a dare spazio ai migliori plugin basati sui modelli open source di IA (ce ne sono di ottimi) ma soprattutto introducendo lo scripting in python e approfondendo la modellazione parametrica (i geometry nodes di Blender) perché è da queste porte che l’IA potrebbe entrare e cambiare radicalmente la CG3D. Con un semplice prompt, un software come Blender potrebbe tra qualche tempo creare interi mondi 3D estremamente dettagliati e animati.

Veniamo dunque alla versione V5 di Midjourney che tra le migliorie introdotte vanta un notevole fotorealismo. La versione V4 aveva già mostrato di essere validissima per qualsiasi tipo di illustrazione, ma ora potrebbe mettere in crisi la stessa fotografia. Partiamo da un confronto tra le varie versioni, dalla V1 alla V5, di questa IA alle prese con un semplice prompt: “Rome street photography”. L’evoluzione è evidentissima:

V1

V2

V3

V4

V5

Con le versioni più evolute, V4 e V5, Midjourney ha restituito principalmente immagini in bianco e nero perché è lo stile maggiormente utilizzato nel genere street. Inoltre ho notato che di default appaiono persone di mezza età o anziane. Se desiderate giovani dovete espressamente richiederli:

Aggiornamento V5.1

Aggiornamento V5.2 con nuova funzione Zoom Out

Se questa è l’evoluzione di un solo anno di Midjourney, è inevitabile chiedersi cosa vedremo nel prossimo quinquennio. Ci troviamo di fronte a investimenti colossali e per tanto dovremmo poter assistere a ulteriori progressi ancora più sorprendenti. Osservando queste immagini generate dall’IA, dobbiamo tener presente che i vicoli e tutte le persone ritratte non esistono nella realtà, ma sono frutto della creatività dell’algoritmo.

Tra i detrattori delle intelligenze artificiali generative, ci sono alcune persone convinte che tali immagini siano una sorta di collage di vere fotografie i cui diritti di autore sarebbero stati lesi, ma evidentemente non hanno alcuna nozione sul funzionamento delle reti neurali. Sebbene queste immagini sembrino fotografie, non lo sono e mai lo sono state. Questa novità nel mondo della grafica ora ha anche un nome: Sintografia.
Per utilizzare Midjourney è necessario accedere all’app Discord, il che potrebbe inizialmente scoraggiare chi preferirebbe una pagina web (come ChatGPT). In realtà questo sistema è molto semplice ed esistono diverse guide che spiegano come procedere. Bastano solo alcune ore per padroneggiare il tutto.

Se volete immaginare come saranno i ragazzi del futuro, i neonati di oggi, Midjourney potrebbe aiutarvi a fare un salto nel tempo (nel 2040)

Buon divertimento e/o buon lavoro con le IA, e mi raccomando… fatene un uso saggio.