by

Il Garante ha annunciato l’avvio di una indagine conoscitiva sui siti Internet per verificare l’adozione di misure di sicurezza adatte ad impedire la raccolta massiva di dati personali. Tale pratica nota come web scraping è stata già oggetto di diversi provvedimenti del Garante, ma per la prima volta l’interesse si rivolge all’utilizzo che ne fanno i sistemi di intelligenza artificiale (“AI”).

Con questa recente indagine, il Garante ha voluto mettere in evidenza il crescente rischio per la protezione dei dati personali derivante dall’espansione incontrollata dei sistemi di intelligenza artificiale (AI). Come ben sappiamo, tali sistemi dipendono da enormi quantità di dati durante la fase di addestramento per affinare e potenziare le loro capacità di elaborazione del linguaggio. Grandi modelli di elaborazione del linguaggio si basano principalmente su una conoscenza composta in gran parte da dati, alcuni dei quali possono essere di natura personale, provenienti da Internet.

È importante notare che esistono misure tecniche che consentono di limitare la raccolta di dati da questi sistemi. Ad esempio, alcuni giornali francesi hanno già adottato iniziative per evitare che i contenuti da loro pubblicati fossero utilizzati senza controllo per lo sviluppo dei sistemi di AI. In questo contesto, l’indagine condotta dal Garante mira a raccogliere commenti e contributi rilevanti sulle misure di sicurezza già adottate e su quelle che possono essere implementate per contrastare la raccolta massiva di dati personali presenti sui siti web.

Il Garante nel febbraio 2022 ha già sanzionato Clearview AI, anche per l’attività di web scraping, la società operava un monitoraggio e una raccolta di dati biometrici all’interno del territorio italiano con l’utilizzo di sistemi di AI. La società è infatti specializzata nel servizio di ricerca che consente la creazione di profili basati su dati biometrici presenti nelle immagini e da altre informazioni connesse. Quel che consente a Clearview di creare questi profili è l’imponente database di circa 10 miliardi di immagini, estratte attraverso il web scraping da fonti web pubbliche – tra cui siti di notizie, social media e video online – su cui si fonda la conoscenza del sistema di AI utilizzato.

Il rinnovato interesse del Garante verso la pratica del web scraping potrebbe concludersi con l’emissione di provvedimenti d’urgenza indirizzati a tutti gli operatori, privati e non, che pubblicano dati personali sui propri siti web. Tali provvedimenti conterranno specifiche misure di sicurezza per evitare una raccolta incontrollata di dati dai propri siti web. Se attuate, queste misure rappresenterebbero al contempo un freno significativo per lo sviluppo dei sistemi di AI e una tutela in più per gli individui cui dati personali sono pubblicati su Internet. L’intramontabile contrasto tra innovazione tecnologica e la tutela dei diritti sui dati personali continua ad evolversi in nuove forme.

Sull’attività del Garante sul web scraping potrebbe interessarvi l’articolo “IA e media: in Francia blocco al web crawling di ChatGPT”.

(Visited 153 times, 1 visits today)
Close Search Window