Harvey AI introduit une vision à la demande pour l'analyse de documents juridiques
James Ding 06 mai 2026 19:05
Le nouveau système de Harvey AI permet un raisonnement précis sur les graphiques et les diagrammes dans les documents juridiques, comblant les lacunes coûteuses des méthodes OCR traditionnelles.
Harvey AI a dévoilé un système de vision à la demande conçu pour relever l'un des défis persistants de la technologie juridique : comprendre et raisonner sur les éléments visuels des documents juridiques. Contrairement aux pipelines OCR (Reconnaissance optique de caractères) traditionnels qui réduisent les graphiques, les diagrammes et les tableaux en texte brut, le nouveau système lit et interprète le contenu visuel uniquement lorsque c'est nécessaire, améliorant ainsi à la fois la précision et l'efficacité.
Les documents juridiques sont rarement composés uniquement de texte ; ils incluent souvent des graphiques financiers, des diagrammes techniques et même des plans d'étage. Ces éléments sont essentiels à la prise de décision, mais sont notoirement difficiles à traiter efficacement pour les systèmes d'IA. La solution de Harvey AI permet aux utilisateurs d'interroger directement ces visuels, en fournissant des réponses détaillées et contextualisées. Par exemple, à la question « Que montre le graphique des revenus à la page 47 ? », le système ne se contente pas d'extraire des données. Il analyse les axes, interpole les points non étiquetés et fournit des informations structurées.
Pourquoi c'est important
Les modèles de traitement de documents traditionnels ne parviennent pas à saisir la complexité des éléments non textuels, ce qui entraîne des lacunes dans les réponses générées par l'IA. Le nouveau système de Harvey s'attaque directement à ces lacunes en employant une approche sélective et pilotée par les requêtes. Au lieu de traiter tous les éléments visuels lors de l'ingestion du document, le système n'active ses capacités de vision que lorsque la question d'un utilisateur l'exige. Cela évite des coûts de calcul inutiles — essentiels pour passer à l'échelle de milliards d'images — et garantit une analyse haute fidélité là où c'est le plus important.
Fonctionnalités clés
- Détection intelligente des pages : Le système identifie les pages pertinentes à l'aide d'une recherche textuelle avant d'analyser les visuels, réduisant un document de 500 pages à une poignée de candidats en quelques millisecondes.
- Rendu haute résolution : Les documents sont convertis en formats cohérents et rendus à haute résolution DPI, préservant les détails tels que les petites légendes de graphiques et les mises en page complexes.
- Raisonnement visuel structuré : Le modèle de vision ne se contente pas de décrire les images — il extrait des valeurs numériques, lit les axes des graphiques et distingue les points de données précis des points approximatifs.
- Optimisation des coûts : En traitant les visuels à la demande, Harvey réduit considérablement les coûts de calcul. Les premiers tests ont révélé que jusqu'à 90 % des éléments visuels d'un document sont inutiles pour répondre aux requêtes des utilisateurs.
Défis et innovations
La création d'un système de vision évolutif pour la technologie juridique a posé des défis uniques. Les documents juridiques varient considérablement en termes de format et de complexité, des annotations manuscrites aux graphiques surdimensionnés. La solution de Harvey intègre des services de rendu haute vitesse et garantit une mise en forme cohérente des documents. De plus, le système intègre une « dégradation élégante », évitant les réponses hallucinées lorsque les éléments visuels sont manquants ou peu clairs. Au lieu de cela, il rapporte ce qu'il peut et ne peut pas déterminer avec certitude.
Enseignements des tests en conditions réelles
Lors des évaluations, le système de Harvey a démontré sa capacité à répondre à des requêtes complexes impliquant des graphiques et des diagrammes avec une grande précision. Il est intéressant de noter que de nombreuses questions ont été résolues en utilisant uniquement le texte, soulignant l'efficacité de la philosophie de conception « texte en premier, vision en second » de Harvey. Cette architecture garantit des réponses rapides pour les requêtes textuelles tout en réservant l'analyse visuelle aux cas véritablement complexes.
Perspectives d'avenir
Harvey AI prévoit d'étendre ses capacités de vision à d'autres domaines, notamment une interprétation plus avancée des diagrammes et un rendu amélioré pour les cas limites. La société est également concentrée sur la réduction de la latence et sur l'amélioration de la capacité de son outil à identifier quand l'analyse visuelle est nécessaire.
Avec cette innovation, Harvey établit un nouveau standard pour l'IA dans la technologie juridique, alliant rentabilité et précision inégalée dans le traitement de documents complexes. Pour les professionnels du droit naviguant dans des affaires à forte densité de données, cet outil représente un bond en avant significatif.
Si la création de systèmes comme celui-ci vous enthousiasme, Harvey AI recrute. Explorez les offres d'emploi ici.
Source de l'image : Shutterstock- ia
- legal tech
- traitement de documents
- harvey ai







