I recenti sviluppi nell’intelligenza artificiale legale hanno generato notevole entusiasmo nel settore, ma la vera sfida rimane come valutare oggettivamente e implementare efficacemente questi strumenti nei flussi di lavoro legali. Il rapporto Vals AI, pubblicato recentemente, ha confrontato quattro strumenti di AI legale con un gruppo di controllo di avvocati su sette attività legali differenti. Sebbene questo tipo di benchmarking sia prezioso, l’implementazione efficace dell’AI richiede una comprensione più sfumata di come questi strumenti si inseriscono nei processi legali complessivi.
AI come elemento di un processo, non sostituzione completa
Un errore comune è considerare l’AI come sostituto diretto del lavoro umano. In realtà, l’AI è solo un componente all’interno di un processo più ampio, e il suo valore si manifesta quando permette di realizzare risultati più efficaci attraverso processi riprogettati. Considerando ad esempio la generazione di cronologie in ambito legale, possiamo identificare diversi modelli di integrazione:
- Processo tradizionale: interamente guidato da avvocati
- AI-centrico: l’AI genera la cronologia, poi revisionata da un avvocato
- Supervisione avanzata: l’avvocato deve conoscere i documenti per verificare efficacemente
- Umano-centrico con supporto AI: l’avvocato mantiene il controllo, con l’AI che fornisce supporto e verifica
La scelta del modello più adatto dipende dal contesto specifico. Una causa complessa dove l’avvocato deve avere una profonda comprensione dei fatti potrebbe richiedere un approccio umano-centrico con supporto AI. Al contrario, una questione più semplice dove i fatti sono già noti potrebbe beneficiare di un approccio più AI-centrico.
Costruire benchmark interni personalizzati
Le demo dei fornitori di soluzioni di AI e i benchmark pubblici raramente riflettono le sfide quotidiane che i team legali devono affrontare per integrare i tool nei propri processi quotidiani. Per valutare efficacemente l’AI, è necessario sviluppare benchmark interni che testino le prestazioni negli specifici flussi di lavoro. Un processo di benchmarking strutturato dovrebbe:
- Identificare le attività legali principali:
- Definire i casi d’uso chiave per la vostra pratica
- Stabilire criteri di successo misurabili (accuratezza, velocità, consistenza)
- Costruire un dataset rappresentativo:
- Raccogliere documenti legali reali in formati diversi (Word, PDF, documenti scansionati)
- Includere contratti standard, documenti normativi e accordi complessi
- Annotare il dataset con esperti legali per creare uno standard di riferimento
- Definire metriche di valutazione specifiche, da adattare caso per caso, ad esempio:
- Accuratezza nell’estrazione di clausole
- Coerenza e affidabilità dei risultati
- Comprensione contestuale e ragionamento legale
- Efficienza nell’elaborazione di documenti complessi
- Testare l’elaborazione visiva dei dati:
- Valutare il riconoscimento OCR per documenti scansionati
- Verificare la correlazione tra testo e elementi visivi (mappe, annotazioni)
Il ruolo dell’accuratezza nel processo
L’accuratezza richiesta varia significativamente in base al contesto. Se state utilizzando l’AI per preparare documenti da presentare in tribunale (es. un atto difensivo) o da pubblicare su un sito web pubblico (es. termini e condizioni), anche piccole imprecisioni nelle citazioni possono compromettere la credibilità dell’intero documento.
In alcuni contesti, il valore dell’AI aumenta proporzionalmente alla sua accuratezza solo dopo aver raggiunto una soglia minima. Al di sotto di questa soglia, il tempo necessario per verificare e correggere l’output potrebbe superare quello richiesto per completare l’attività manualmente. In altri contesti, dopo un certo livello di accuratezza, il valore aggiunto potrebbe stabilizzarsi.
Esempio pratico: benchmark per analisi di contratti d’affitto
Consideriamo un caso pratico: un ufficio legale interno che opera in diverse giurisdizioni europee (Italia, Francia, Germania) e regolarmente analizza contratti d’affitto commerciali. Un benchmark efficace dovrebbe testare come uno strumento AI:
- Estrae clausole chiave:
- Clausole di recesso
- Meccanismi di revisione del canone
- Responsabilità di manutenzione
- Risoluzione delle controversie
- Gestisce differenze giurisdizionali:
- Specificità del diritto italiano (es. cedolare secca, prelazione)
- Differenze significative nel diritto francese e tedesco
- Applicazione del diritto dell’Unione Europea
- Integra dati visivi:
- Associazione di obblighi contrattuali con planimetrie catastali
- Interpretazione di documentazione tecnica degli immobili
Un benchmark ben strutturato dovrebbe comprendere una varietà di documenti in diversi formati, inclusi documenti scansionati, redatti e annotati. I risultati andrebbero poi confrontati con uno standard creato da esperti legali per valutare accuratamente le prestazioni rispetto ai risultati attesi. Consideriamo che una soluzione ottimale è quella ottenuta attraverso varie iterazioni, adattandola alle esigenze specifiche.
Oltre l’accuratezza: ulteriori elementi da valutare
Un processo di benchmarking efficace deve considerare numerosi fattori oltre alla semplice accuratezza:
- Velocità: quanto è cruciale ottenere risultati in tempi rapidi?
- Rilevanza qualitativa: quale livello di qualità è effettivamente necessario per lo specifico contesto d’uso?
- Efficienza economica: quale rapporto costi-benefici è sostenibile per l’organizzazione?
- Trasparenza: in che misura è necessario che le conclusioni siano tracciabili e giustificabili?
- Coerenza metodologica: quanto è importante che un’attività venga eseguita in modo uniforme ogni volta?
- Estrazione di conoscenza: l’AI riesce a identificare e catalogare informazioni che un professionista non avrebbe tempo di registrare sistematicamente?
- Supervisione umana: in quale punto del processo è possibile prevedere una attività di supervisione efficiente che non comprometta il tempo risparmiato al professionista?
Conclusioni
L’AI da sola non fornisce valore – lo genera solo nel contesto di un processo ben progettato. Per comprendere veramente il valore dell’AI nel mondo legale, dobbiamo:
- Capire cosa vogliamo ottenere dal processo
- Trovare il modo migliore di integrare l’AI
- Confrontare il processo potenziato dall’AI con il metodo tradizionale
Costruendo benchmark interni rigorosi che testano le prestazioni dell’AI nei vostri specifici flussi di lavoro e contesti giurisdizionali, potrete adottare strumenti AI con maggiore fiducia, assicurandovi che migliorino l’efficienza senza compromettere l’accuratezza legale o la gestione del rischio.
Nel nostro team abbiamo sviluppato una metodologia di benchmarking specifica per i team legali che si occupano di materie IPT, contattateci per sapere di più.
Su un argomento simile può essere d’interesse l’articolo: “IA e Legal Tech: soluzioni innovative per rivoluzionare la professione legale“