Pullulano con improbabili con centinaia di migliaia di visualizzazioni: Taylor Swift con Lady Gaga, Eminem con Billie Eilish, fino ad arrivare a Freddie Mercury con Kurt Cobain (Mercury è morto nel 1991, quando i Nirvana erano appena esplosi, e Cobain tre anni dopo).
Il fenomeno non risparmia il repertorio italiano: su YouTube esiste una versione di Margherita di Elodie e Marracash cantata da Rihanna e Kanye Westcosì come una cover di Se ne va di Nayt eseguita con la voce clonata di Fabrizio De André.
C’è anche un video andato virale su TikTok con un singolo di Il Dipartimento dei Poeti Torturatil’album di Taylor Swift del 2024, creato e diffuso prima che l’album uscisse: qualcuno aveva immaginato il suono di un disco che non aveva ancora ascoltato, usando la voce clonata dell’artista. Il falso ha così preceduto il reale.
Spesso le stesse canzoni non esistenti sono pubblicate e ripubblicate da una molteplicità di account diversi e scollegati tra di loro e il tutto è spesso accompagnato da videoclip eseguiti con l’Intelligenza Artificiale (alcuni facilmente riconoscibili come tali, altri no) che vedono protagonisti proprio questi artisti famosi.
Ma come fanno questi video a non essere rimossi dal potentissimo Content ID di YouTube, il sistema di riconoscimento automatico del copyright in cui la società ha investito oltre 100 milioni di dollari, che scansiona continuamente l’intera piattaforma, confronta ogni upload con un database di oltre 50 milioni di file di riferimento e ha distribuito più di due miliardi di dollari in royalties ai detentori di diritti dalla sua introduzione nel 2008? E, ancora prima: come si creano questi contenuti? La risposta è più semplice, e più accessibile, di quanto si pensi.
Gli strumenti di clonaggio della voce, software come ElevenLabs, RVC, e decine di alternative open source scaricabili gratuitamente da chiunque abbia una connessione Internetsono in grado di replicare una voce a partire da trenta secondi di audio pulito. Il risultato non è una copia di una esistente: è una sintesi nuova, tecnicamente inedita, registrazione che ne imita il timbro, l’inflessione, il respiro. Ed è esattamente questa separazione, tra copia e imitazione, che tiene in piedi tutto il sistema. Content ID funziona riconoscendo le corrispondenze con registrazioni esistenti nel suo database. Una voce sintetica non corrisponde a nulla: è nuova. E, quindi, non c’è niente da bloccare.
L’unico strumento rimasto è la segnalazione manuale, che richiede che qualcuno noti il video, lo segnali, e che la piattaforma intervenga. Su Spotify, dove il flusso di upload passa per distributori con i propri termini di servizio, il filtro è più stretto, ma il problema strutturale è lo stesso: senza una corrispondenza automatica, non esiste rimozione automatica.
Il 4 aprile 2023, un utente TikTok noto solo come Ghostwriter977 carica sulle piattaforme una canzone intitolata Il cuore sulla manicacon le voci di Drake e Il fine settimana generare dall’intelligenza artificiale. I due artisti non ne sanno nulla, e in pochi giorni la canzone raggiunge quindici milioni di visualizzazioni su TikTokquasi 300 mila su YouTube, e oltre 600.000 stream su Spotify. Nei commenti al suo video, Ghostwriter977 scrive: «Sono stato un ghostwriter per anni e ho guadagnato quasi niente mentre le major si arricchivano. Il futuro è qui». Universal Music Group, che rappresenta entrambi gli artisti, cerca di rimuovere la canzone e si trova davanti a un problema: tecnicamente non possiede quel brano, e quindi non può usare Content ID. Riesce a ottenere la rimozione probabilmente agganciandosi all’unico elemento potenzialmente coperto da copyright presente nella traccia, il tag produttore di Metro Boomin (la firma audio che i produttori inseriscono all’inizio delle loro tracce per identificarsi), quattro secondi di audio all’inizio della canzone. Drake risponde su Instagram: «Questa è la goccia che fa traboccare il vaso, AI». La canzone viene poi sottoposta alla Recording Academy per una nomination ai Nonna: Harvey Mason Jr., presidente dell’istituzione, contatta direttamente Ghostwriter977, prima dichiarandola candidabile perché scritta da un essere umano, poi ritrattando – «i vocals non erano stati legalmente ottenuti» – nel giro di quarantotto ore. Il più grande gruppo discografico del mondo ferma un deepfake solo grazie a una firma vocale di pochi secondi.
