IA : Saul-Instruct, un LLM dédié au droit

Legaltech
Outils
TAILLE DU TEXTE

La legaltech Equall propose un LLM (Large Language Model - Grand modèle de langage) ouvert et spécialement conçu pour répondre aux exigences du monde juridique.

Une équipe internationale transdisciplinaire

Le développement de Saul-Instruct résulte de la collaboration d'une équipe internationale transdisciplinaire composée d'experts en machine learning, d'avocats et de juristes provenant du laboratoire MICS de CentraleSupélec, de l'Université Paris-Saclay, de l’Université Paris-Sorbonne, ainsi que de l'Universidade de Lisboa et de la NOVA School of Law au Portugal. Cette synergie d'expertise a permis de créer un grand modèle de langage ouvert spécifiquement dédié au domaine juridique.

Constitution du LLM à partir d’un vaste corpus de données juridiques

Saul-Instruct a été formé sur un large ensemble de données juridiques provenant de sources en open data, englobant les juridictions américaines et européennes. Cette approche vise à garantir une compréhension approfondie du droit, permettant ainsi au modèle d'offrir des capacités de traitement du langage naturel adaptées aux besoins des avocats et des professionnels du droit.

Pour ses créateurs, Saul-Instruct - nommé d'après la série télévisée américaine Better Call Saul - surpasse les autres modèles de 7 milliards de paramètres sur des benchmarks juridiques, confirmant que l'adaptation de domaine conduit à des performances supérieures dans les tâches juridiques et éclairant la voie pour des explorations ultérieures.

saulllm donnees

Jorge Mattamouros, ancien associé chez White & Case LLP à New York, qui a créé par la start-up Equall.ai, à l’origine de Saul-Instruct, estime que, dans la prochaine décennie, jusqu'à 80 % du travail juridique (recherche, examen et analyse de documents, résumé et identification des passages clés dans les documents) peut être traitée par l’intelligence artificielle.

Ce qui distingue Saul-Instruct des grands modèles de langage, c'est sa capacité à comprendre et à analyser des documents juridiques complexes, à extraire des informations clés et à produire des résumés précis, facilitant ainsi le travail des avocats dans la recherche, l'analyse et la rédaction de documents.

Réduire les « hallucinations » grâce à la spécialisation

Un aspect fondamental du travail réalisé sur Saul-Instruct réside dans sa capacité à réduire les « hallucinations » souvent associées aux grands modèles de langage. En se concentrant sur la spécialisation des modèles et en les reliant à des sources juridiques précises, le LLM entend garantir la précision et la fiabilité de ses résultats.

Les LLM restent des modèles probabilistes. Les hallucinations font partie des LLM. Cependant, lorsqu'ils sont invités à générer du texte sur des sujets et des données similaires aux données sur lesquelles le LLM a été formé, les LLM ont tendance à halluciner beaucoup moins.

Par exemple, tout au long de l’évaluation de Saul-Instruct avec des avocats, l’équipe à l’origine du LLM a pu confirmer qu'il était moins enclin à halluciner lorsqu'il discutait de concepts juridiques spécifiques. En résumé, les LLM spécifiquement formés sur les données juridiques hallucinent beaucoup moins sur les données juridiques que leurs homologues généralistes.

Perspectives

Jorge Mattamouros, ancien associé chez White & Case LLP à New York et fondateur d'Equall.ai, souligne que l'avenir des LLM réserve encore de nombreuses possibilités inexploitées. Il est convaincu que ces modèles changeront radicalement l’approche du traitement et de la génération de données, notamment dans le domaine juridique où l'obtention de données de haute qualité est essentielle mais souvent coûteuse et difficile à réaliser.

« Notre conviction est que les systèmes spécialisés dans le domaine juridique seront plus performants que les systèmes généralistes. Cela inclut une plus grande précision et des outils plus utiles pour aider les avocats à se concentrer sur ce qu'ils aiment le plus et font le mieux, c'est-à-dire exercer leur analyse juridique et aider leurs clients avec des conseils » explique le fondateur d’Equall.

Pour pouvoir continuer à améliorer les performances de son LLM, Equall est actuellement en pourparlers avec des fonds d'investissement en Europe et aux États-Unis.

Ce modèle a déjà suscité un vif intérêt, avec plus de 25 000 téléchargements par des développeurs, des cabinets d'avocats, des organismes publics et des entreprises du monde entier.

Arnaud Dumourier