I querelanti nella causa Kadrey et al. contro Meta hanno presentato una mozione in cui affermano che l’azienda ha utilizzato consapevolmente opere protette da copyright nello sviluppo dei suoi modelli di intelligenza artificiale.
I querelanti, tra cui l’autore Richard Kadrey, hanno presentato la loro “Reply in Support of Plaintiffs’ Motion for Leave to File Third Amended Consolidated Complaint” presso la Corte Distrettuale degli Stati Uniti nel Distretto Nord della California.
L’atto di citazione accusa Meta di aver sistematicamente effettuato il torrenting e di aver tolto le informazioni sulla gestione del copyright (CMI) da set di dati pirata, tra cui le opere della famigerata biblioteca ombra LibGen.
Secondo i documenti recentemente presentati al tribunale, le prove rivelano pratiche altamente incriminanti che coinvolgono i dirigenti di Meta. I querelanti sostengono che l’amministratore delegato di Meta, Mark Zuckerberg, ha dato l’approvazione esplicita per l’uso del set di dati LibGen, nonostante le preoccupazioni interne sollevate dai dirigenti dell’azienda che si occupano di AI.
Un promemoria del dicembre 2024, frutto di discussioni interne a Meta, riconosceva LibGen come “un set di dati che sappiamo essere piratato”, con dibattiti sulle ramificazioni etiche e legali dell’uso di tali materiali. I documenti hanno anche rivelato che gli ingegneri più importanti esitavano a utilizzare il torrent per i dataset, citando la preoccupazione di utilizzare i laptop aziendali per attività potenzialmente illegali.
Inoltre, le comunicazioni interne suggeriscono che dopo aver acquisito il set di dati LibGen, Meta ha eliminato il CMI dalle opere protette da copyright contenute al suo interno, una pratica che i querelanti evidenziano come fondamentale per le denunce di violazione del copyright.
Secondo la deposizione di Michael Clark – un rappresentante aziendale di Meta – l’azienda ha implementato degli script progettati per rimuovere qualsiasi informazione che identificasse queste opere come protette da copyright, incluse parole chiave come “copyright”, “ringraziamenti” o righe comunemente usate in questi testi. Clark ha testimoniato che questa pratica è stata fatta intenzionalmente per preparare il set di dati per l’addestramento dei modelli Llama AI di Meta.
“Non mi sembra giusto”
Le accuse contro Meta dipingono il ritratto di un’azienda che partecipa consapevolmente a un diffuso schema di pirateria facilitato dal torrenting.
Secondo una serie di e-mail incluse tra gli allegati, gli ingegneri di Meta hanno espresso preoccupazione per l’ottica del torrenting di set di dati pirata all’interno di spazi aziendali. Un ingegnere ha osservato che “fare torrenting da un laptop aziendale [di proprietà di Meta] non mi sembra corretto”, ma nonostante le esitazioni, il rapido download e la distribuzione – o “seeding” – di dati pirata hanno avuto luogo.
Il legale dei querelanti ha dichiarato che già nel gennaio 2024 Meta aveva “torrentato (scaricato e distribuito) i dati di LibGen” Inoltre, i documenti mostrano che centinaia di documenti correlati erano stati inizialmente ottenuti da Meta mesi prima, ma sono stati trattenuti durante i primi processi di scoperta. I querelanti sostengono che questa divulgazione ritardata equivale a un tentativo in malafede da parte di Meta di ostacolare l’accesso a prove vitali.
Durante una deposizione del 17 dicembre 2024, lo stesso Zuckerberg avrebbe ammesso che tali attività avrebbero sollevato “un sacco di bandiere rosse” e ha dichiarato che “sembra una cosa negativa”, anche se ha fornito risposte dirette limitate riguardo alle pratiche più ampie di Meta per l’addestramento dell’intelligenza artificiale.
Questa causa è nata originariamente come un’azione di violazione della proprietà intellettuale per conto di autori ed editori che lamentavano violazioni relative all’uso dell’IA sui loro materiali. Tuttavia, i querelanti stanno ora cercando di aggiungere due importanti rivendicazioni alla loro causa: una violazione del Digital Millennium Copyright Act (DMCA) e una violazione del California Comprehensive Data Access and Fraud Act (CDAFA).
In base al DMCA, i querelanti affermano che Meta ha consapevolmente rimosso le protezioni del copyright per nascondere l’uso non autorizzato di testi protetti da copyright nei suoi modelli Llama.
Come si legge nella denuncia, Meta avrebbe eliminato il CMI “per ridurre la possibilità che i modelli memorizzino questi dati” e la rimozione degli indicatori di gestione dei diritti avrebbe reso più difficile per i titolari del copyright scoprire la violazione.
Le accuse del CDAFA riguardano i metodi utilizzati da Meta per ottenere il dataset LibGen, tra cui il presunto coinvolgimento nel torrenting per acquisire dataset protetti da copyright senza autorizzazione. La documentazione interna mostra che gli ingegneri di Meta hanno discusso apertamente la preoccupazione che il seeding e il torrenting potessero rivelarsi “legalmente non corretti”
Il caso Meta potrebbe avere un impatto sulla legislazione emergente in materia di sviluppo dell’intelligenza artificiale
Al centro di questa battaglia legale in espansione c’è la crescente preoccupazione per l’intersezione tra la legge sul copyright e l’IA.
I querelanti sostengono che l’eliminazione delle protezioni del copyright dai dataset testuali nega il giusto compenso ai proprietari dei diritti d’autore e permette a Meta di costruire sistemi di IA come Llama sulle rovine finanziarie degli sforzi creativi di autori ed editori.
La tempistica di queste accuse si inserisce nel contesto di un maggiore controllo globale sulle tecnologie di “IA generativa”. Aziende come OpenAI, Google e Meta sono finite sotto tiro per l’uso di dati protetti da copyright per addestrare i loro modelli. I tribunali di tutte le giurisdizioni si stanno attualmente occupando dell’impatto a lungo termine dell’IA sulla gestione dei diritti, con casi potenzialmente epocali decisi sia negli Stati Uniti che nel Regno Unito.
In questo caso particolare, i tribunali statunitensi si sono dimostrati sempre più disposti ad ascoltare le denunce relative al potenziale danno dell’IA ai precedenti della legge sul copyright, ormai consolidati. I querelanti, nella loro mozione, hanno fatto riferimento a The Intercept Media v. OpenAI, una recente decisione di New York in cui è stato permesso di procedere con una richiesta di risarcimento DMCA simile.
Meta continua a negare tutte le accuse del caso e non ha ancora risposto pubblicamente alle dichiarazioni di Zuckerberg riportate nella deposizione.
Indipendentemente dal fatto che i querelanti riescano o meno a far valere le proprie ragioni, gli autori di tutto il mondo sono sempre più preoccupati per la gestione delle loro opere creative nel contesto dell’IA. Con la legge sul copyright che fatica a tenere il passo con i progressi tecnologici, questo caso sottolinea la necessità di una guida più chiara a livello internazionale per proteggere sia i creatori che gli innovatori.
Per Meta, queste rivendicazioni rappresentano anche un rischio di reputazione. Dato che l’IA diventa il fulcro della sua strategia futura, è improbabile che le accuse di affidarsi a librerie pirata aiutino le sue ambizioni di mantenere la leadership nel settore.
Il caso di Kadrey et al. contro Meta potrebbe avere ramificazioni di vasta portata per lo sviluppo di modelli di IA in futuro, creando potenzialmente dei precedenti legali negli Stati Uniti e non solo.
Leggi di più su www.artificialintelligence-news.com

Consulente di comunicazione, social media, SEO ed e-commerce. Grafico, web designer, impaginatore, copertinista e addentrato quanto basta in tutto ciò che riguarda l’Internet. Appassionato di narrativa, arti visive e cinema di menare. Nerd. Gamer.
Vivo e lavoro come freelancer in provincia di Taranto.