Les capacités de recherche les plus avancées pour les questions juridiques et les investigations

Avantages de ZyLAB | Techniques de recherche | Recherches floues et approximatives | Recherche judiciaire

Le moteur de recherche de ZyLAB est optimisé pour obtenir un taux de récupération maximum. En d'autres termes, au lieu de trouver uniquement le « meilleur » résultat de la recherche, un moteur de recherche optimisé pour la récupération trouvera tous les résultats susceptibles d'être pertinents. Ce niveau de précision est particulièrement important pour les investigations intensives de haut niveau.

Les 25 années de R&D intensifs de ZyLAB en matière de techniques de recherche ont débouché sur un système qui aide les clients à tirer le meilleur parti de leurs données. Les autres produits sont incapables de trouver certaines de vos informations ou ils obligent l'utilisateur à effectuer un processus de normalisation des données coûteux, à renseigner les champs clés manuellement ou à employer d'autres formes de nettoyage des données.

Optimisez vos recherches avec ZyLAB, sans vous encombrer de « parasites »

  • ZyLAB peut effectuer une recherche plein texte sur les données textuelles dans plus de 400 langues et dans plus de 700 formats de fichiers électroniques différents, dans les e-mails, les supports multimédia et les documents papier numérisés.
  • En plus de rechercher et d'extraire le contenu textuel des documents, ZyLAB recherche et extrait aussi les propriétés de fichier caché des documents. Cela vous offre une multitude d'informations supplémentaires à rechercher.
  • Avec la fonctionnalité primée, robuste et évolutive de recherche floue de ZyLAB, vous pouvez trouver des mots malgré les fautes d'orthographe, les erreurs de numérisation, les erreurs de reconnaissance optique des caractères, les différences de traduction lorsqu'un nom est converti à partir d'un autre alphabet, les différences orthographiques des noms pharmaceutiques et chimiques, les fautes de frappe et les expressions booléennes négociées dans les divulgations juridiques.
  • Les e-mails sont un format très complexe. On peut trouver des e-mails imbriqués dans d'autres e-mails qui contiennent encore d'autres e-mails, des documents, des éléments de calendrier et des tâches. Lorsque vous utilisez le module d'archivage des e-mails de ZyLAB, vous pouvez effectuer une recherche dans chaque composant du message d'un e-mail, même les objets les plus profondément intégrés. Cela est rendu possible grâce à Microsoft Exchange Connector et à l'outil de conversion des e-mails (PST, NSF ou GroupWise à XML) inclus avec le module.
  • Les fils d'e-mails et plus de 100 propriétés d'e-mail peuvent également être extraits, explorés et visualisés.
  • ZyLAB peut identifier un large éventail de mémoires d'images et les soumettre à la reconnaissance optique des caractères dans 200 langues (même avec la reconnaissance de la langue automatique) afin de pouvoir y effectuer des recherches. Il est possible d'effectuer des recherches dans ces mémoires d'images, qu'elles soient stockées dans un système de fichiers ou fournies en pièce jointe d'un e-mail.
  • Même lorsqu'un mot ne se trouve pas dans un document ou quand il est masqué dans le document ou les propriétés du fichier, le serveur analytique de ZyLAB peut extraire les données cachées ou soumettre le texte d'un document à un extracteur conceptuel pour trouver les notions sémantiques, créer un résumé, extraire les entités ou les modèles complexes ou révéler des liens inconnus entre les personnes, les entreprises, les lieux et les événements. Toutes ces données extraites peuvent ensuite être utilisées pour rechercher, organiser et classer les documents plus efficacement (voir aussi la section Analyses de textes)
  • ZyLAB comprend une fonction de repérage manuel et des outils pour organiser les documents, comme : les tables des matières statiques, les dossiers de recherche dynamiques, les arborescences conceptuelles hiérarchiques, les annotations, les tampons, les liens hypertexte, les catégorisations, les intégrations aux bases de données et le renseignement des champs clés manuel.
  • ZyLAB offre plusieurs outils pour personnaliser le comportement du moteur de recherche, comme : les mots parasites, l'identification des jetons, les mappages de caractères, la prise en charge des pages de code et Unicode, les opérateurs traduisibles, la ponctuation et le traitement des tirets et des apostrophes. Les formats de fichiers non reconnus et chiffrés peuvent être détectés automatiquement et déplacés dans des endroits spéciaux pour subir un traitement approfondi. En outre, tous les aspects des processus d'indexation, d'extraction et de recherche ont des fonctions d'audit et de journalisation étendues.

Trouver et gérer les informations sont des points critiques, mais la capacité à gérer ces informations une fois trouvées est tout aussi importante. Aucun autre prestataire ne vous offre une gamme d'outils comme celle de ZyLAB pour vous aider à gérer et à contrôler tous les types d'informations, indépendamment de leur format.

Un vaste éventail de techniques de recherche

ZyLAB vous propose les techniques de recherche suivantes pour vous aider à trouver ce que vous cherchez : recherches booléenne, de proximité (dirigée), d'expression, floue, approximative, conceptuelle, par date, par champ clé, par propriété de fichier, par propriété de document, d'entité, progressive, quorum, par translittération et par plage numérique.

En outre, divers outils de classement par pertinence, d'aide à la recherche et outils navigationnels sont disponibles, comme la densité de frappe, le tri par champ clé, la mise en surbrillance des résultats, la navigation dans les résultats, le vocabulaire, la recherche historique, les synonymes, la prise en charge taxonomique, l'affichage des mots clés dans le contexte, l'affinage des résultats (également appelé recherche à facettes), la recherche de résultats similaires, la visualisation avancée de la liste des résultats (arborescence, arbres hyperboliques et intégration à Google maps), la fédération (avec la norme de recherche ouverte ATOM), l'intégration à un moteur de recherche sur Internet (prise en charge Sitemap.org), l'alerte automatique et la recherche de documents dans une table des matières.

Des extracteurs sont disponibles pour les entités, les faits, les événements, les propriétés de fichiers, les propriétés de documents, les champs clés, les balises HTML et XML, la reconnaissance de langue automatique, les résumés automatiques, la traduction automatique, la catégorie de document, etc. Pour en savoir plus, reportez-vous à la section Analyses de textes.

Recherche floue et recherche approximative

Une recherche floue peut localiser toutes les occurrences d'un mot, ainsi que tous les autres mots qui se rapprochent de l'orthographe du mot original. Le degré de flou spécifie le degré de similitude avec le mot original et contribue à contrôler la quantité des résultats obtenus. La fonction de recherche floue de ZyLAB est optimisée pour détecter les erreurs de reconnaissance optique des caractères, les fautes d'orthographe et les différences d'orthographe des noms dérivés d'alphabets non romains comme le cyrillique, l'arabe, le farsi, l'hindi, l'hébreu, le chinois et le japonais.

Un des principaux avantages des algorithmes flous de ZyLAB est que la recherche floue est effectuée indépendamment de la langue et de l'application. De plus, contrairement à de nombreux produits concurrents, elle n'a pas besoin d'être « formée ». La recherche floue de ZyLAB conserve un niveau de précision excellent, même à des degrés de flou élevés, et la différence de performance entre les grands ensembles de données et les petits ensembles de données est négligeable. Même lorsque le premier caractère d'un mot est différent du mot de la requête, la recherche floue de ZyLAB parvient à retrouver ce mot. Contrairement à la plupart des autres produits, la recherche floue de ZyLAB permet même au premier caractère d'être différent.

En plus de la recherche floue, ZyLAB peut également effectuer une recherche avec divers caractères de remplacement sans compromettre la vitesse de recherche : ABC*, *ABC, A*C et même *ABC* sont des possibilités. Peu d'autres moteurs en sont capables, en particulier en ce qui concerne la recherche *ABC. Pour l'application de la loi et la divulgation, ces techniques de recherche sont très importantes car il pratiquement impossible d'énumérer toutes les variantes de mots non reconnus, mal orthographiés ou de préfixes et suffixes dans les mots concaténés et fléchis.

Les recherches juridiques nécessitent un processus de recherche défendable:

  • • Prise en charge des recherches booléennes, de proximité et de quorum complexes à grande échelle et imbriquées
    • Recherche floue rapide (avec prise en charge des changements de premier caractère) et recherche approximative avancée (a*, *a, a*a et *a*)
    • Mise en surbrillance des résultats et navigation à travers les résultats
    • Classement par pertinence reproductible et fiable
    • Indexage judiciaire des propriétés des fichiers et des documents
    • Reconnaissance de la langue automatique
    • Capacités d'indexage pour les objets composés comme les e-mails imbriqués, les fichiers compressés, les collectes d'e-mails, Microsoft SharePoint, les bases de données et plus encore
    • Audit et reporting des processus d'indexage et de recherche étendus
    • Indexage incrémentiel des données réseau en direct
    • Intégration aux processus de gestion des dossiers, de prise judiciaire, d'identification, de collecte, d'examen judiciaire, de production (TIFF) et de rédaction
    • Analyse de texte avancée, catégorisation des documents et traduction automatique
    • Un moteur de recherche mentionné dans la jurisprudence existante