by

Il Tribunale di Amburgo ha posto dei limiti all’opt-out da parte dei titolari dei diritti d’autore all’uso dei contenuti per il training dell’intelligenza artificiale (“AI“).

Con una decisione del 27 settembre 2024, il Tribunale distrettuale di Amburgo ha emesso una sentenza significativa riguardante il diritto d’autore e l’uso dell’AI, in un caso che ha visto contrapposti Robert Kneschke, un fotografo professionista, e l’organizzazione no-profit LAION (Large-scale Artificial Intelligence Open Network). Kneschke ha accusato LAION di violazione del diritto d’autore, sostenendo che l’organizzazione avesse riprodotto senza autorizzazione una sua fotografia per creare un dataset destinato all’addestramento di sistemi di AI generativa.

Il caso relativo all’uso di contenuti protetti dal diritto d’autore per il training dell’AI

LAION ha sviluppato un dataset open-access per il training di sistemi AI, che raccoglie quasi sei miliardi di hyperlink a immagini accessibili online, accompagnati dalle rispettive descrizioni testuali. Per realizzare il dataset, LAION ha scaricato le immagini dagli archivi online e ha utilizzato un software per verificare che le descrizioni presenti nel dataset di origine corrispondessero al relativo contenuto visivo. Le immagini non conformi alle descrizioni sono state scartate, mentre quelle che corrispondevano al testo, sono state incluse nel dataset insieme ai relativi metadati come l’URL e la descrizione. Per svolgere tale analisi e verificare la corrispondenza testo-immagine, LAION ha dovuto temporaneamente memorizzare le immagini.

La contestazione del fotografo Robert Kneschke è nata dal fatto che LAION avrebbe violato il suo diritto d’autore utilizzando senza autorizzazione una fotografia da lui scattata per la creazione di un dataset destinato all’addestramento di sistemi di AI. L’immagine in questione è stata analizzata da LAION, che l’ha poi inserita nel proprio dataset. Il file della fotografia è stato scaricato dal sito web di un’agenzia fotografica con cui Kneschke collaborava, ed era contraddistinto dal watermark dell’agenzia. Inoltre, i termini di servizio del sito web dell’agenzia recitano espressamente che “l’utente non può utilizzare programmi automatici, applet, bot o simili per accedere al sito web o a qualsiasi contenuto in esso presente per qualsiasi scopo, compresi, a titolo puramente esemplificativo, il download di contenuti, l’indicizzazione, lo scraping o la memorizzazione nella cache di qualsiasi contenuto del sito web“.

Kneschke ha dunque presentato ricorso contro LAION denunciando una violazione del proprio diritto d’autore, sostenendo che l’organizzazione no-profit avesse riprodotto la sua fotografia senza autorizzazione durante il processo di creazione del dataset. In particolare, secondo il fotografo, questa riproduzione non rientra nelle eccezioni previste dagli articoli 44a, 44b e 60d della legge sul diritto d’autore tedesca (“UrhG“).

LAION, invece, si è difesa sostenendo che la propria condotta rientrasse nel perimetro dell’eccezione di text and data mining (“TDM“) per scopi di ricerca scientifica, come previsto dall’articolo 60d UrhG. Ha inoltre dichiarato che l’uso dell’immagine contestata è stato solo temporaneo, in quanto questa è eliminata subito dopo l’analisi, e non conservata in modo permanente. Infine, LAION ha precisato che il dataset creato non contiene le riproduzioni grafiche delle fotografie, ma solamente i link alle immagini disponibili online, sostenendo così di non aver violato il diritto d’autore del fotografo.

La decisione del tribunale di Amburgo sull’uso dell’AI per finalità di training

Il Tribunale distrettuale di Amburgo ha respinto il ricorso del fotografo Kneschke e ha accolto le difese di LAION, stabilendo che la riproduzione delle immagini a scopo di analisi del contenuto e della relativa descrizione testuale deve essere distinta dall’uso per l’addestramento dei sistemi di AI. Secondo il Tribunale tedesco, la creazione da parte di LAION del dataset gratuito rientra nell’eccezione di TDM per scopi di ricerca scientifica di cui all’articolo 3 della Direttiva Copyright e all’articolo 60d dell’UrhG.

La text and data mining exception per scopi di ricerca scientifica

La Corte ha ritenuto che la riproduzione di un’immagine per la creazione di un dataset come base per l’addestramento di sistemi di AI rientri nella eccezione di text and data mining (“TDM“) per scopi di ricerca scientifica. In particolare, è stato osservato che “la ricerca scientifica si riferisce generalmente al perseguimento metodico-sistematico di nuove conoscenze. […] La ricerca scientifica non presuppone un successivo successo della ricerca. Di conseguenza la creazione di un dataset che può essere la base per l’addestramento di sistemi di AI, può ritenersi effettuata per scopi di ricerca scientifica“.

A conferma dell’assenza di scopo commerciale, la Corte tedesca ha inoltre rilevato che il dataset è stato reso liberamente e gratuitamente disponibile al pubblico. E, il fatto che il dataset possa essere utilizzato anche da società con scopo di lucro per l’addestramento o l’ulteriore sviluppo dei loro sistemi di AI è irrilevante ai fini della qualificazione del tipo di attività svolta da LAION, perché anche la ricerca svolta da società con scopo di lucro è pur sempre attività di ricerca, utile per raggiungere nuove conoscenze. Il Tribunale di Amburgo ha inoltre chiarito che l’esistenza di eventuali rapporti tra LAION e altre società con fini commerciali attive nel settore dell’AI non implica che tali aziende esercitino un’influenza determinante sulle attività di LAION. Peraltro, ha precisato la Corte, non è stato dimostrato che LAION abbia fornito un accesso privilegiato ai risultati della sua ricerca a queste aziende, circostanze che (invece) avrebbe ostacolato la possibilità di invocare l’eccezione di cui all’articolo 60d dell’UrhG.

Il meccanismo di “opt-out” all’uso dei dati per il training dell’AI

La Corte ha basato la sua decisione principalmente sull’articolo 60b dell’UrhG, ritenendo che l’attività di LAION rientri nell’eccezione di text and data mining (TDM) per scopi scientifici. Di conseguenza, si è limitata a trattare la questione dell’opt-out in un obiter dictum. Sul punto, il Tribunale ha affermato che l’esercizio dell’opt-out attraverso un linguaggio semplice, come lettere in chiaro, è sufficiente per permettere ai titolari dei diritti di esprimere la loro riserva. Inoltre, ha stabilito che non è necessario che l’opt-out sia formulato in un formato machine-readable, come i file robots.txt, poiché le tecnologie attuali, comprese quelle basate sull’intelligenza artificiale, dovrebbero essere in grado di interpretare il linguaggio umano. Pertanto, è sufficiente che la riserva sia espressa in un formato “machine understandable” (ovvero, comprensibile dai sistemi di AI). Tuttavia, la Corte ha chiarito che questa non è una regola generale e ogni caso deve essere valutato in base al progresso tecnico del momento.

Questa apertura introduce nuove sfide per le imprese nel settore dell’AI: se l’opt-out formulato con un linguaggio naturale è considerato “machine readable“, i sistemi di AI dovranno essere in grado di elaborare testi scritti in un linguaggio umano per identificare tali riserve.

L’uso temporaneo delle immagini per finalità di training

Quanto alla difesa di LAION, secondo cui le immagini sarebbero state utilizzate solo “temporaneamente”, il Tribunale di Amburgo ha rigettato tale argomentazione, ritenendo che la riproduzione effettuata dalla convenuta non potesse essere considerata “transitoria” o “accessoria”. Infatti, i file immagine sono stati scaricati e analizzati in modo consapevole e intenzionale, indicando così che il processo di download non fosse semplicemente un passaggio accessorio del processo di analisi, ma piuttosto un atto di acquisizione consapevole e controllato da LAION. Pertanto, il Tribunale ha escluso che LAION potesse avvalersi dell’eccezione di cui all’articolo 44b dell’UrhG nel caso in esame.

Quale sarebbe stato l’esito della controversia in Italia?

Se il caso in oggetto fosse stato deciso in Italia, la decisione probabilmente non sarebbe stata diversa da quella adottata dal Tribunale distrettuale di Amburgo. Infatti, l’art. 70-ter della legge italiana sul diritto d’autore, in attuazione dell’art. 3 della Direttiva Copyright, consente l’estrazione di testo e dati per scopi di ricerca scientifica. La norma stabilisce che gli enti di ricerca includono università, istituti e altre entità con finalità di ricerca. Questa nozione non richiede che la ricerca scientifica costituisca l’unico obiettivo “statutario” dell’ente, ma è sufficiente che sia quello principale: ed è perciò compatibile con lo svolgimento di attività imprenditoriali a latere di quella di ricerca scientifica. L’art. 70-ter stabilisce che un ente non può essere considerato “organismo di ricerca” se è soggetto a un’influenza determinante da parte di imprese commerciali che garantisca loro un accesso preferenziale ai risultati della ricerca. Tale influenza è compatibile con la qualifica di organismo di ricerca per una società controllata, purché l’accesso privilegiato ai risultati della ricerca sia escluso. Pertanto, secondo la normativa italiana, anche società commerciali possono qualificarsi come enti di ricerca, purché rispettino i requisiti previsti dall’art. 70-ter.

Alla luce di quanto sopra, si ritiene che un Tribunale italiano avrebbe considerato l’attività di LAION conforme alla normativa sul diritto d’autore, dato che è orientata alla ricerca scientifica e non persegue fini commerciali.

Conclusioni

La decisione del Tribunale di Amburgo risulta essere ben motivata e riflette la complessità di trovare un equilibrio tra i diritti di proprietà intellettuale e l’avanzamento della tecnologia AI. La Corte ha valutato in modo approfondito l’applicabilità delle varie eccezioni al diritto d’autore, schierandosi infine a favore degli interessi della ricerca scientifica. Questa sentenza mette in evidenza le sfide che il diritto d’autore tradizionale deve affrontare nell’era dell’AI, in cui la raccolta e l’analisi massiccia dei dati sono essenziali per lo sviluppo tecnologico.

La decisione lascia tuttavia alcune domande senza risposta, in particolare riguardo all’adeguatezza dell’opt-out per i contenuti online e a come l’esercizio della riserva dovrebbe essere trattato nel contesto del data mining per l’AI.

Su un argomento simile può essere di interesse l’articolo ” Il training dell’AI con brani musicali: le principali etichette discografiche stanno facendo causa a start-up di AI generativa

(Visited 87 times, 1 visits today)
Close Search Window