Pulse-MDR-Wefind-moteur-de-recherche-loupe
Mes billets pros Pulse

La puissance du moteur de recherche de la plateforme web, Pulse

We find vous aide, vous conseille et développe pour vous une plateforme web vous permettant de collaborer et de gérer vos documents d’entreprise. PULSE permet l’import, la recherche et l’accès à vos documents métiers que vous soyez mobile (mode Saas) ou non étant accessible depuis un navigateur grâce à son interface web, unique. Comment s’y retrouver dans un grand volume de fichiers ? Comment trouver le document souhaité ? Un outil indispensable offre une aide précieuse à la recherche de vos documents rapidement et simplement sans perdre de temps : le moteur de recherche en mode « full text search ».  

Qu’est-ce qu’un moteur de recherche ? 

Un moteur de recherche permet à un utilisateur de rechercher un dossier, un répertoire ou un document, de rechercher des alertes, des collaborateurs, du média (vidéo, image). Il s’agit, donc, de trouver des ressources à partir de requêtes établies. Un moteur de recherche est un outil permettant de rechercher et de trouver facilement et rapidement sur le web, sur son PC, mais aussi, au sein de plateformes cloud comme PULSE, par exemple. La recherche peut être simplifiée (un champ simple à la Google) ou avancée (composée de plusieurs champs reliés par des opérateurs booléens : AND/ET, SAUF/NOT, OU/OR ou utilisant des filtres ou facettes permettent une recherche plus précise et plus fine.

Qu’est-ce que le crawle ?

Sur le web, le moteur de recherche crawle (robots indexeurs), c’est-à-dire qu’il va parcourir l’ensemble des pages web, suivre l’ensemble des liens hypertextes et adresses URL.

Au sein de la plateforme PULSE, le moteur de recherche utilise le même procédé, celui de crawler/de parcourir l’ensemble de la base. Le système recherche dans l’ensemble de la Data Room PULSE, dans tous les dossiers, déjà existants. Mais, aussi, dans chacun des dossiers nouvellement créés. C’est une technique de recherche au sein d’un document électronique (contenu) quel que soit son format et à l’intérieur des fichiers ou dossiers présents dans la base de données.

Le moteur de recherche « Full text search » de Pulse.

La plateforme PULSE de Wefind intègre un moteur de recherche puissant en mode « Full text » à la Google caractérisé par un champ simple. Ce qu’on appelle recherche plein texte ou recherche plein texte intégral ou encore recherche de texte libre. C’est une technique de recherche au sein d’un document électronique (contenu) quel que soit son format et à l’intérieur des fichiers ou dossiers présents dans la base de données. Le système recherche dans l’ensemble de la Data Room PULSE, dans tous les dossiers, déjà existants. Mais, aussi, dans chacun des dossiers nouvellement créés.

Le moteur de recherche est présent sur la page d’accueil de la plateforme PULSE et est représenté par un champ unique à la Google. Il permet une recherche simple en tapant un mot ou groupe nominal dans le champ applicable. La recherche s’effectue par mot-clé, partie de mots, expression, phrase, chaîne de caractères quelconque, synonymes.

Il reconnait la casse (majuscule/minuscule), les singuliers et les pluriels, l’auto-complétion (complément de mots à partir de ses premières lettres tapées) par l’utilisation de deux méthodes, celle des mots-clés (à partir de l’historique de recherche qu’il garde en mémoire) ou de l’analyse sémantique prenant en compte le sens des mots en utilisant les relations de sens entre plusieurs mots grâce à un lexique intégré. 

Il donne, également, la possibilité de rechercher les mots à leur lemme (lemmatisation) par une analyse lexicale qui permet de regrouper les mots d’une même famille ensemble: position>positionner>positionnant. Le moteur de recherche corrige, également, les fautes de frappe.

Le mot-clé peut-être un nom (collaborateur ou client), le nom d’un dossier, fichier ou répertoire, un thème, le titre ou extrait de titre d’un document, un auteur, une date de création, le nom du modificateur…

Les résultats de la recherche 

Ils se présentent sous la forme d’un listing dont le mot recherché est en surbrillance jaune. Le moteur de recherche informe où le document recherché est stockéLes résultats de la recherche peuvent être à nouveau affinés grâce aux filtres placés à gauche de la liste. Les filtres se présentent comme des menus déroulants déployés avec une sélection du choix par l’utilisation de coches. Il est possible de classer les résultats de recherche en fonction de vos critères : fréquence, date, popularité…comme de peaufiner leur affichage. La personnalisation permet l’optimisation des résultats de la recherche en affichant les plus pertinents.

Les résultats de la recherche sont rapides, réellement très rapides et scalables. Les réponses sont instantanées. Cette rapidité répond à une technologie pointue, celle de l’indexation inversée avec des transducteurs à états finis. Accéder et exploiter vos données en un temps record. Principe de l’indexation inversée.

Le principe de l’indexation inversée

D’une manière générale, un index est l’association de descripteurs à un ensemble de documents auquel le descripteur renvoi (indexation automatique). La plateforme web PULSE utilise le moteur de recherche « Elasticsearch » qui collecte, d’abord, des documents en lien avec les autres (ingestion/collecte de données) et utilise une structure dénommée « indexation inversée » Apache Lucene, en open-source.

Le système cherche dans tous les contenus de la base. Il s’agit d’un index ou liste de mots unique issu d’un document par reconnaissance de son contenu. L’index comprend, alors, une liste de tous les documents dans lesquels le mot apparaît. Il s’agit d’une correspondance entre du contenu (mots, nombres) et sa position dans l’ensemble de la base de données (document ou ensemble de documents). Elasticsearch crée automatiquement cet index inversé pour permettre de rechercher un document en temps quasi réel. Le but étant de permettre une recherche plein texte plus rapide.

Intégration du moteur de recherche dans le système d’information

Le moteur de recherche « Elasticsearch » en mode « full text search » est une API RESTful (communication/architecture client/serveur) comme la plateforme web PULSE. Les deux solutions s’intègrent facilement dans le système d’information de l’entreprise. Elles peuvent interagir avec les applications métiers et logiciels Documentum, Nextcloud, SuiteCRM, SAP comme avec la GED Alfresco en API REST, également, dont SYNAPTURE est intégrateur facilitant leur communication et leur connexion. La recherche documentaire s’en trouve alors plus rapide et simplifiée.

 

Ce billet fut, d’abord, publié sur le blog de We find en août 2022.

Source photo : Wefind

 

Vous pourriez également aimer...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *