Google Search Appliance - Robot d’exploration
de base de données
Aperçu des fonctionnalités
Présentation
Le nouveau robot d’exploration de base de données du système Google Search
Appliance permet d’accéder aux informations stockées dans les bases de donnés
des entreprises, et d’effectuer des recherches complètes et globales que les
données soient structurées ou non. Grâce à ce robot d’exploration, les utilisateurs
accèdent à des données professionnelles qui sont stockées dans des systèmes de
gestion de documents, dans des applications d’entreprise ou dans des systèmes de
base de données personnalisés. Tout contenu stocké dans des bases de données
relationnelles d’entreprise standard peut être inclus dans les recherches.
Recherche de contenu
Le robot d’exploration de base de données du système Google Search Appliance
utilise le langage normalisé SQL (Structured Query Language) afin de déterminer les
informations à extraire de la base de données. Pour configurer la connexion à une
base de données, l’administrateur du système de recherche commence par définir les
informations de connexion, notamment le nom d’hôte et le port de la base de données,
le nom de la base et les informations d’identification d’accès (nom d’utilisateur et
mot de passe). Il définit ensuite la requête d’exploration qui est une instruction SQL
permettant de récupérer les informations souhaitées dans la base de données.
Exemple :
Pour une base de données « employee » contenant les champs :
employee_id, first_name, last_name, email, dept
La requête d’exploration peut se présenter comme suit :
SELECT employee_id, first_name, last_name, email, dept FROM employee
Cette requête permet de récupérer l’ensemble des informations de la base relatives
aux employés qui correspondent aux critères indiqués dans la requête. Ces
informations sont extraites de la base de données pour être ensuite importées dans
le système Google Search Appliance où elles sont indexées. L’utilisation de requêtes
d’exploration incrémentielles permet à l’administrateur de définir une instruction
SQL qui cible les insertions, les mises à jour et les suppressions effectuées dans
la base de données afin que le contenu soit en permanence actualisé et enrichi.
L’administrateur est en mesure de sélectionner avec précision les champs à explorer
et peut facilement exclure certains champs de l’exploration ou des résultats de
recherche renvoyés.
Indexation d’enregistrements
La requête d’exploration (telle que définie ci-dessus) génère un ensemble
d’enregistrements qui sont exportés vers le système Google Search Appliance
pour être indexés. Le système convertit ensuite chaque enregistrement de la
base de données en document HTML par le biais d’une feuille de style XSLT.
L’administrateur peut, par défaut, utiliser la feuille de style qui génère un
tableau résumant clairement les paires nom/valeur pour chaque enregistrement.
L’administrateur peut alternativement appliquer une feuille de style personnalisée
afin de formater les informations selon les besoins. Grâce à l’utilisation de la norme
XSLT, l’administrateur peut formater l’enregistrement de la base de données de
la façon la plus adaptée à chaque utilisateur, notamment en générant des balises
META pour des recherches spéciales et limitées.
SPÉCIFICATIONS