Indagine del Garante sull’uso del web scraping

14 Dicembre 2023• byDLA Piper

Il Garante ha annunciato l’avvio di una indagine conoscitiva sui siti Internet per verificare l’adozione di misure di sicurezza adatte ad impedire la raccolta massiva di dati personali. Tale pratica nota come web scraping è stata già oggetto di diversi provvedimenti del Garante, ma per la prima volta l’interesse si rivolge all’utilizzo che ne fanno i sistemi di intelligenza artificiale (“AI”).

Con questa recente indagine, il Garante ha voluto mettere in evidenza il crescente rischio per la protezione dei dati personali derivante dall’espansione incontrollata dei sistemi di intelligenza artificiale (AI). Come ben sappiamo, tali sistemi dipendono da enormi quantità di dati durante la fase di addestramento per affinare e potenziare le loro capacità di elaborazione del linguaggio. Grandi modelli di elaborazione del linguaggio si basano principalmente su una conoscenza composta in gran parte da dati, alcuni dei quali possono essere di natura personale, provenienti da Internet.

È importante notare che esistono misure tecniche che consentono di limitare la raccolta di dati da questi sistemi. Ad esempio, alcuni giornali francesi hanno già adottato iniziative per evitare che i contenuti da loro pubblicati fossero utilizzati senza controllo per lo sviluppo dei sistemi di AI. In questo contesto, l’indagine condotta dal Garante mira a raccogliere commenti e contributi rilevanti sulle misure di sicurezza già adottate e su quelle che possono essere implementate per contrastare la raccolta massiva di dati personali presenti sui siti web.

Il Garante nel febbraio 2022 ha già sanzionato Clearview AI, anche per l’attività di web scraping, la società operava un monitoraggio e una raccolta di dati biometrici all’interno del territorio italiano con l’utilizzo di sistemi di AI. La società è infatti specializzata nel servizio di ricerca che consente la creazione di profili basati su dati biometrici presenti nelle immagini e da altre informazioni connesse. Quel che consente a Clearview di creare questi profili è l’imponente database di circa 10 miliardi di immagini, estratte attraverso il web scraping da fonti web pubbliche – tra cui siti di notizie, social media e video online – su cui si fonda la conoscenza del sistema di AI utilizzato.

Il rinnovato interesse del Garante verso la pratica del web scraping potrebbe concludersi con l’emissione di provvedimenti d’urgenza indirizzati a tutti gli operatori, privati e non, che pubblicano dati personali sui propri siti web. Tali provvedimenti conterranno specifiche misure di sicurezza per evitare una raccolta incontrollata di dati dai propri siti web. Se attuate, queste misure rappresenterebbero al contempo un freno significativo per lo sviluppo dei sistemi di AI e una tutela in più per gli individui cui dati personali sono pubblicati su Internet. L’intramontabile contrasto tra innovazione tecnologica e la tutela dei diritti sui dati personali continua ad evolversi in nuove forme.

Sull’attività del Garante sul web scraping potrebbe interessarvi l’articolo “IA e media: in Francia blocco al web crawling di ChatGPT”.

(Visited 311 times, 1 visits today)

About the Author: DLA Piper

I riferimenti dello Studio Legale DLA Piper sono disponibili qui https://www.dlapiper.com/it/italy/

La definizione di dato personale rimane invariata: impatto del Digital Omnibus sull’addestramento dell’IA

La definizione di dato personale rimane invariata nel quadro del Digital Omnibus. Cosa significa questo per...

Indagine di EIOPA su GenAI e assicurazioni: a che punto siamo?

Il 2 febbraio 2026 EIOPA ha pubblicato la sua indagine a livello UE sull’adozione dell’Intelligenza...

Previous: Entra in vigore il regolamento UE sulla protezione delle indicazioni geografiche (IG) per i prodotti artigianali e industriali: prime informazioni utili

Next: Accordo finale del Parlamento e Consiglio dell’UE sul Digital Identity Wallet

Indagine del Garante privacy sull’uso del web scraping per l’addestramento dei sistemi di Intelligenza Artificiale

About the Author: DLA Piper

Related Posts

Indagine di EIOPA su GenAI e assicurazioni: a che punto siamo?

Popular This Week

Daily Popular

Indagine del Garante privacy sull’uso del web scraping per l’addestramento dei sistemi di Intelligenza Artificiale

About the Author: DLA Piper

Related Posts

Gli identificatori dei cookie pubblicitari sono dati personali? Una decisione del Consiglio di Stato francese solleva interrogativi per l’Ad Tech e l’addestramento dell’AI

La definizione di dato personale rimane invariata: impatto del Digital Omnibus sull’addestramento dell’IA

Indagine di EIOPA su GenAI e assicurazioni: a che punto siamo?

Popular This Week

Daily Popular