Al momento stai visualizzando I dati protetti da copyright sono “impossibili” da evitare per l’addestramento delle IA
  • Save

I dati protetti da copyright sono “impossibili” da evitare per l’addestramento delle IA

 

OpenAI ha fatto scalpore questa settimana con la sua audace affermazione a una commissione parlamentare del Regno Unito secondo cui sarebbe “impossibile” sviluppare i principali sistemi di IA di oggi senza utilizzare grandi quantità di dati protetti da copyright.

L’azienda ha sostenuto che gli strumenti di intelligenza artificiale avanzati come ChatGPT richiedono una formazione così ampia che il rispetto delle leggi sul copyright sarebbe del tutto impraticabile.

Nella sua testimonianza scritta, OpenAI ha affermato che tra le leggi espansive sul copyright e l’ubiquità dei contenuti online protetti, “praticamente ogni tipo di espressione umana” sarebbe off-limits per i dati di formazione. Dagli articoli di giornale ai commenti sui forum alle immagini digitali, pochi contenuti online possono essere utilizzati liberamente e legalmente.

Secondo OpenAI, i tentativi di creare un’intelligenza artificiale capace evitando la violazione del copyright fallirebbero: “Limitare i dati di addestramento ai libri e ai disegni di pubblico dominio creati più di un secolo fa… non consentirebbe di creare sistemi di IA in grado di soddisfare le esigenze dei cittadini di oggi”

Pur difendendo le sue pratiche come conformi, OpenAI ha ammesso che partnership e schemi di compensazione con gli editori possono essere giustificati per “sostenere e dare potere ai creatori” Tuttavia, l’azienda non ha dato alcuna indicazione circa la sua intenzione di limitare drasticamente la raccolta di dati online, compresi quelli relativi al giornalismo e alla letteratura a pagamento.

Questa posizione ha esposto OpenAI a numerose cause legali, anche da parte di media come il New York Times che lamentano violazioni del copyright.

Ciononostante, OpenAI non sembra intenzionata a modificare radicalmente i suoi processi di raccolta e formazione dei dati, visti i vincoli “impossibili” che comporterebbe l’imposizione di limiti al copyright. L’azienda spera invece di affidarsi a un’ampia interpretazione dei diritti di utilizzo per sfruttare legalmente vaste porzioni di dati protetti da copyright.

Poiché l’intelligenza artificiale avanzata continua a dimostrare sorprendenti capacità di emulare l’espressione umana, gli esperti legali si aspettano vigorose battaglie in tribunale contro le violazioni da parte di sistemi intrinsecamente progettati per assorbire enormi volumi di testi, media e altri prodotti creativi protetti.

Per il momento, OpenAI scommette contro i massimalisti del copyright a favore di una copia quasi illimitata per favorire lo sviluppo dell’IA.

Leggi di più su www.artificialintelligence-news.com

Lascia un commento