Primi limiti delle Intelligenze Artificiali generative

L’intelligenza artificiale non inventa nulla. E questo vale anche per le Generative AI: l’ultima generazione di algoritmi di deep learning.

Autore

Andrea Daniele Signorelli

Data

27 Marzo 2023

AUTORE

TEMPO DI LETTURA

4' di lettura

DATA

27 Marzo 2023

ARGOMENTO

PAROLE CHIAVE


AI

Società

CONDIVIDI

L’intelligenza artificiale non inventa nulla. E questo vale anche per le Generative AI: l’ultima generazione di algoritmi di deep learning in grado di rispondere in maniera conversazionale a ogni nostra domanda (come ChatGPT), creare composizioni musicali (JukeBox) o produrre illustrazioni in ogni stile possibile (come Midjourney o Dall-E 2).

Così come avviene con qualunque altro strumento basato sul deep learning – dalla selezione dei post di Instagram in base ai vostri gusti fino agli algoritmi che si occupano di scegliere i curricula più adatti a un posto di lavoro – anche i sistemi di intelligenza artificiale generativa non fanno altro che individuare le correlazioni presenti all’interno dei dati a disposizione, in questo caso ricombinandoli nel modo possa avere le maggiori probabilità, dal punto di vista statistico, di essere coerente con le richieste.

Come?

Un esempio relativo proprio alla generazione di immagini ci aiuta a chiarire il quadro.

Nel 2019, un algoritmo di intelligenza artificiale creato da Nvidia aveva ricevuto il compito di generare da zero delle immagini di gatti. Il sistema era stato addestrato sfruttando centinaia di migliaia di fotografie provenienti dal web. Quando i risultati sono apparsi i ricercatori si sono accorti che moltissimi dei gatti generati dal sistema di intelligenza artificiale erano accompagnati da scritte incomprensibili, al di sopra e al di sotto dell’immagine principale raffigurante (in maniera più o meno precisa) un gatto.

Per quale ragione la AI aveva cercato di creare anche delle scritte? La ragione è in realtà semplice: moltissimi dei gatti presenti nel database usato per l’addestramento dell’algoritmo provenivano da meme. Dal momento che i sistemi di deep learning, per imparare a riconoscere e riprodurre un gatto, si limitano a scovare statisticamente gli aspetti comuni presenti in tutte le immagini di gatti, questa intelligenza artificiale (tecnicamente una GAN, generative adversarial network) aveva considerato i testi dei meme con protagonisti gatti come parte integrante di ciò che un gatto è.

Lo stesso discorso, almeno in linea generale, vale per Midjourney, Stable Diffusion, Dall-E 2 e tutte le altre intelligenze artificiali di ultima generazione in grado di creare illustrazioni sulla base dei nostri comandi testuali. In realtà non stanno inventando nulla: si limitano a ricomporre statisticamente i pixel delle immagini presenti nel database in base alle parole chiave impiegate. 

Insomma se date in pasto a una AI tutte le opere di Picasso, e poi le chiedete di creare un quadro nello stile di Picasso, non farà che rielaborare e ricomporre il materiale di partenza per generare un’ottima imitazione dello stile di Picasso. Non sarebbe però in grado di imitare nessun altro stile e nemmeno di creare qualcosa che non ricordi, inevitabilmente, sempre Picasso.

Ovviamente, più il dataset è vario, maggiore è la possibilità che la creazione sia (apparentemente) più originale, rendendo a volte incomprensibile quale sia il materiale di partenza utilizzato. Ciononostante sono ormai numerosi i casi in cui svariati artisti hanno trovato, nelle opere prodotte, per esempio, da Midjourney, delle ‘creazioni’ che erano state chiaramente generate partendo dal loro lavoro, senza che però avessero dato alcun assenso – e senza aver ricevuto nessun compenso. 

È un plagio?
È una rielaborazione legittima?

Il diritto d’autore viene infranto perché il materiale di partenza è effettivamente degli autori originali oppure dobbiamo considerare queste creazioni delle opere nuove, che semplicemente riprendono lo stile di questo o quell’artista?

Il tema è spinoso e ha ispirato, anche in Italia, delle riflessioni estremamente interessanti. Se vogliamo guardare al passato, uno dei precedenti storici che forse ricorda più da vicino la difficoltà che abbiamo a interpretare questo nuovo fenomeno è legato a un altro settore: la musica. 

Negli anni Ottanta l’hip hop inizia a diffondersi negli Stati Uniti. Le basi musicali sono però già allora – come spesso avviene ancora oggi – prodotte campionando materiale già esistente: giri di chitarra di pezzi celebri, sonate di pianoforte di musicisti classici, batterie tratte da brani di James Brown, ecc…

A volte questi campionamenti sono talmente rielaborati da rendere praticamente irriconoscibile il materiale di partenza; in altri casi c’è invece proprio la volontà di riutilizzare una parte in maniera assolutamente riconoscibile. Al vuoto legislativo iniziale si è gradualmente sostituita la necessità di chiedere i diritti per sfruttare determinati brani musicali (anche se non sempre tutto avviene in maniera così limpida).

È possibile individuare una soluzione simile anche nel caso dell’arte algoritmicamente generata? Per quanto le due situazioni siano – almeno dal punto di vista del riutilizzo del materiale di partenza – sovrapponibili, la questione non è così semplice. 

Chi dovrebbe retribuire gli artisti? Chi programma il software o chi lo utilizza?
Si può pensare a un modello in cui si offre a un artista un forfait per poter sfruttare le sue creazioni?

Il tema terrà sicuramente svegli gli esperti di diritto d’autore per i mesi – se non gli anni – a venire. C’è però un altro aspetto che preoccupa illustratori e altri creatori di contenuti di vario tipo: adesso che chiunque è in grado di utilizzare questi strumenti per dare vita a creazioni (apparentemente, non sempre) originali, che fine faranno le loro professioni?

Nel gennaio 2023, per esempio, la testata BuzzFeed ha annunciato che avrebbe sfruttato ChatGPT per aumentare il numero di quiz generati sul sito. Allo stesso tempo sempre più riviste hanno creato illustrazioni di copertina usando Dall-E 2 e affini.
La professione di illustratore rischia l’estinzione, sostituita dalle intelligenze artificiali?

In realtà le cose non sono (mai) così semplici. 

Prima di tutto gli illustratori potrebbero per esempio diventare – anche – degli esperti utilizzatori di questi strumenti: sfruttando le loro competenze per dare i comandi migliori, per riconoscere le opere di maggiore qualità, per affinare i risultati generati ecc. 

Non solo. È possibile che, col tempo, le immagini generate a livello amatoriale (ma talvolta usate anche in contesti professionali) diventeranno l’equivalente odierno delle fotografie di stock: un’alternativa economica, spesso abusata e poco originale delle fotografie create appositamente da professionisti.

Come riporta il New Yorker, quando il celeberrimo cartoonist giapponese Hayao Miyazaki ha avuto modo di vedere, nel 2016, delle animazioni generate dall’intelligenza artificiale, la sua reazione è stata a dir poco tranchant:
«Ho la netta sensazione che questo sia un insulto alla vita stessa».

Un’affermazione forse eccessiva, ma che ci aiuta a tenere presente un aspetto: per quanto evolute queste intelligenze artificiali – prive come sono di qualunque comprensione reale del lavoro che stanno svolgendo – non possono del tutto sostituire l’essere umano, avendo bisogno dei dati di partenza da esso creati, e soprattutto della sua guida.

Più che un vero e proprio artista, questi sistemi di intelligenza artificiale generativa ricordano degli ottimi assistenti. E questo è un altro tema che inevitabilmente si apre: d’accordo, forse le intelligenze artificiali non sostituiranno gli artisti (soprattutto di buon livello), ma i loro assistenti umani che fine faranno?

I temi aperti dalla diffusione di questi sistemi sono però ancora più vasti: che ruolo giocheranno nel mondo dell’educazione, diventeranno uno strumento che aiuta gli studenti a scoprire e ad approfondire o renderanno ancora più superficiale l’apprendimento? Smetteremo forse di pensare, come si temeva che sarebbe avvenuto già ai ‘tempi’ di Google?

Tra il controllo di uno strumento sempre più potente e il rischio invece che sia esso ad addomesticare noi, cercheremo – con il prossimo articolo – di immaginare il futuro dell’essere umano ai tempi di ChatGPT.

Leggi anche
Tecnologia
Viva Voce
1′ di lettura

Nuove opere, tutti i dati in un singolo modello

di Eleonora Battaglia
Tecnologia
Coordinate
8′ di lettura

Alla ricerca della Singolarità Tecnologica

di Alessandro Leonardi
Tecnologia
Coordinate
4′ di lettura

Sepolture celestiali

di Tiziana Panizza Kassahun
Tecnologia
Viva Voce

Nuove opere, tutti i dati in un singolo modello

di Eleonora Battaglia
1′ di lettura
Cultura
Viva Voce

Mondo animale e nativi americani

di Edoardo Serini
5′ di lettura
Società
Viva Voce

Naturalmente unico. Comunicarsi fuoriclasse del biologico

di Gloria Ballestrasse
3′ di lettura
Politiche
Viva Voce

Retorica, iperboli e strategie semantiche della comunicazione di Trump

di Massimiliano Frenza Maxia
5′ di lettura
Scienza
Viva Voce

I polpi possono cambiare colore: ma a quale costo?

di Redazione
3′ di lettura
Economia
Viva Voce

Etica e leadership sostenibile: il vero lavoro delle HR

di Antonella Cozzi
5′ di lettura

Credits

Ux Design: Susanna Legrenzi
Grafica: Maurizio Maselli / Artworkweb
Web development: Synesthesia