Un importante gruppo editoriale ha aggiunto un esplicito riferimento all’intelligenza artificiale (AI) nel copyright notice (ossia la pagina dove viene indicato il copyright sull’opera) dei suoi libri e ristampe di nuova pubblicazione. Una delle “Big Five” delle case editrici mondiali ha stabilito che nessuna parte delle opere potrà essere utilizzata o riprodotta in alcun modo per il training di tecnologie o sistemi di AI. Si tratta del primo esempio di azione da parte di una casa editrice contro l’uso delle opere pubblicate sia su carta sia digitalmente per addestrare tecnologie di intelligenza artificiale (AI), quali large language models (LLM).
I copyright notice sono utilizzati dagli editori per affermare i propri diritti e quelli dei loro autori su libri stampati e pubblicati digitalmente. In particolare, questa pagina viene solitamente utilizzata per informare il lettore degli utilizzi dell’opera che possono e non possono essere legalmente fatti. In ogni caso, anche quando non si utilizzano specifici disclaimer, le previsioni vigenti in materia di diritto d’autore sono comunque applicabili.
Aggiungendo un riferimento all’addestramento dei sistemi di AI nel proprio copyright notice, la casa editrice ha di fatto escluso che le sue opere possano essere utilizzate per sviluppare e fare training di chatbot e altri sistemi di AI. Tale decisione sarebbe una risposta al fatto che in passato è stato più volte denunciato che l’addestramento degli strumenti AI sarebbe stata fatto utilizzando libri pubblicati (anche illegalmente) senza il consenso e l’autorizzazione dei titolari dei diritti.
Inoltre, la nuova stesura del copyright notice, che sarà aggiunto i libri di prossima pubblicazione, sancisce espressamente che l’editore si riserva l’utilizzo delle opere per le attività di text and data mining, secondo quanto previsto dall’articolo 4, paragrafo 3, della Direttiva (UE) 2019/790 sul diritto d’autore e sui diritti connessi nel mercato unico digitale (“Direttiva Copyright“).
L’articolo 2 della Direttiva Copyright definisce text and data mining qualsiasi “tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni“. Come previsto dall’articolo 4 della Direttiva Copyright, possono essere previste eccezioni o limitazioni ai diritti esclusivi su opere protette da diritto d’autore, a cui si ha legalmente accesso, per permettere di svolgere attività di text and data mining. Il paragrafo 3 dell’articolo 4 della Direttiva Copyright specifica che tali eccezioni o limitazioni si applicano solamente a condizione che i titolari dei diritti non abbiano espressamente riservato l’uso delle opere in un modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online.
La nuova versione di copyright notice di una delle “Big Five” del settore editoriale dovrebbe funzionare in modo simile ai protocolli di esclusione contenuti nei file “robots.txt”, utilizzati dai siti web per escludere i propri contenuti dalle attività di scraping da parte di bot e tecnologie AI. È, quindi, un primo passo dell’editoria verso l’adozione di misure più chiare ed esplicite da parte degli editori sulla decisione di riservare l’esercizio dei diritti relativi ad attività di training e di text and data mining da parte di sistemi AI in relazione alle opere da loro pubblicate.
La decisione di una delle più importanti case editrici di riscrivere il proprio copyright notice vietando l’utilizzo delle proprie opere per il training di sistemi AI evidenzia ulteriormente le tensioni che si sono sviluppate tra creatori di contenuti e il mondo dell’AI. Un numero crescente di editori, autori e operatori del settore è sempre più attivo nel chiedere misure di protezione più forti e definite dei propri diritti esclusivi, adottando un approccio “di difesa” nei confronti delle tecnologie di AI, soprattutto rispetto al loro training e alla produzione di output in usi generativi. In tal senso, è stata circolata la notizia che un’altra importante casa editrice avrebbe recentemente adottato misure che vietano ai propri collaboratori freelance, che lavorano sui libri degli autori pubblicati dalla stessa casa editrice, di copiare le informazioni e i testi contenuti nelle opere in sistemi e programmi di AI a scopo di editing, verifica, estrazione o qualsiasi altro fine correlato.
In aggiunta agli interventi adottati delle case editrici, gli autori e le loro organizzazioni rappresentative chiedono cambiamenti nei contratti editoriali al fine di includere adeguate tutele. Gli accordi con gli editori dovrebbero, infatti, garantire che il consenso degli autori sia ottenuto prima che gli editori utilizzino o consentano l’uso delle opere per addestrare i sistemi di AI e, più in generale, prima di concedere l’accesso all’opera a una tecnologia AI, ad esempio per produrre traduzioni, audiolibri e copertine di libri protetti da diritto d’autore tramite la stessa AI.
Inoltre, diversi rappresentanti delle industrie creative si sono espressi a favore dell’introduzione di più complete norme e previsioni che tengano atto dello sviluppo delle tecnologie. Dovrebbero essere introdotte disposizioni adeguate e trasparenti in materia di licenze, per garantire che i creatori e i titolari dei diritti siano adeguatamente pagati per l’utilizzo delle loro opere, anche nel contesto degli usi effettuati dai sistemi di AI. In tal senso, sono in fase di elaborazione nuove licenze per la lettura automatica di testi e l’estrazione di dati che consentono alle tecnologie che effettuano automaticamente lo scraping di contenuti protetti dal diritto d’autore di accedervi legittimamente, in alcuni casi verso il pagamento di un corrispettivo.
In ambito editoriale, e non solo, i titolari dei diritti, sia gli autori sia gli editori, sono sempre più interessati a mantenere un controllo significativo su come e in che misura le loro opere interagiscono con i sistemi di AI, ricevendo al contempo un compenso equo per qualsiasi sfruttamento delle loro opere.
Su un simile argomento potrebbe interessarti: L’intelligenza artificiale generativa può fare affidamento sulla eccezione copyright text and data mining (TDM) per il suo addestramento?