Google Search Appliance - Robot d`exploration de base de données

publicité
Google Search Appliance - Robot d’exploration
de base de données
Aperçu des fonctionnalités
Présentation
Le nouveau robot d’exploration de base de données du système Google Search
Appliance permet d’accéder aux informations stockées dans les bases de donnés
des entreprises, et d’effectuer des recherches complètes et globales que les
données soient structurées ou non. Grâce à ce robot d’exploration, les utilisateurs
accèdent à des données professionnelles qui sont stockées dans des systèmes de
gestion de documents, dans des applications d’entreprise ou dans des systèmes de
base de données personnalisés. Tout contenu stocké dans des bases de données
relationnelles d’entreprise standard peut être inclus dans les recherches.
Recherche de contenu
SPÉCIFICATIONS
Bases de données prises en charge :
IBM DB2
Microsoft SQLServer
MySQL
Oracle
Sybase
Le robot d’exploration de base de données du système Google Search Appliance
utilise le langage normalisé SQL (Structured Query Language) afin de déterminer les
informations à extraire de la base de données. Pour configurer la connexion à une
base de données, l’administrateur du système de recherche commence par définir les
informations de connexion, notamment le nom d’hôte et le port de la base de données,
le nom de la base et les informations d’identification d’accès (nom d’utilisateur et
mot de passe). Il définit ensuite la requête d’exploration qui est une instruction SQL
permettant de récupérer les informations souhaitées dans la base de données.
Google Search Appliance
Exemple :
Matériel : version 4.0 ou ultérieure
Logiciel : version 4.2 ou ultérieure
Pour une base de données « employee » contenant les champs :
employee_id, first_name, last_name, email, dept
CONTACTS
La requête d’exploration peut se présenter comme suit :
SELECT employee_id, first_name, last_name, email, dept FROM employee
www.google.fr/enterprise
Adresse e-mail
[email protected]
Cette requête permet de récupérer l’ensemble des informations de la base relatives
aux employés qui correspondent aux critères indiqués dans la requête. Ces
informations sont extraites de la base de données pour être ensuite importées dans
le système Google Search Appliance où elles sont indexées. L’utilisation de requêtes
d’exploration incrémentielles permet à l’administrateur de définir une instruction
SQL qui cible les insertions, les mises à jour et les suppressions effectuées dans
la base de données afin que le contenu soit en permanence actualisé et enrichi.
L’administrateur est en mesure de sélectionner avec précision les champs à explorer
et peut facilement exclure certains champs de l’exploration ou des résultats de
recherche renvoyés.
Indexation d’enregistrements
La requête d’exploration (telle que définie ci-dessus) génère un ensemble
d’enregistrements qui sont exportés vers le système Google Search Appliance
pour être indexés. Le système convertit ensuite chaque enregistrement de la
base de données en document HTML par le biais d’une feuille de style XSLT.
L’administrateur peut, par défaut, utiliser la feuille de style qui génère un
tableau résumant clairement les paires nom/valeur pour chaque enregistrement.
L’administrateur peut alternativement appliquer une feuille de style personnalisée
afin de formater les informations selon les besoins. Grâce à l’utilisation de la norme
XSLT, l’administrateur peut formater l’enregistrement de la base de données de
la façon la plus adaptée à chaque utilisateur, notamment en générant des balises
META pour des recherches spéciales et limitées.
GOOGLE SEARCH APPLIANCE
Traitement des résultats
Une fois le contenu de la base de données indexé, les utilisateurs peuvent y effectuer
des recherches. Dans la mesure où le système Google Search Appliance assure la
maintenance d’un index unifié de l’ensemble du contenu de l’entreprise, les utilisateurs
ne sont pas contraints d’utiliser une interface distincte en fonction de la base où
résident les données. L’administrateur du système de recherche peut autoriser les
recherches dans un ensemble de données unique ou dans l’intégralité du contenu de
l’entreprise par le biais des collections illimitées du système Google Search Appliance.
L’administrateur peut également choisir la manière dont sont affichés les résultats
lorsqu’un utilisateur effectue une recherche avec le système Google Search
Appliance et sélectionne un résultat dans la base de données. Il peut ainsi définir
une requête de traitement qui extrait l’enregistrement le plus récent pour un résultat
donné et lui applique la feuille de style précédemment définie pour l’affichage.
Exemple :
Requête de traitement :
SELECT employee_id, first_name, last_name, email, dept
FROM employee
WHERE employee_id = ?
Champ de clé primaire pour cet exemple : employee_id
L’administrateur du système de recherche peut aussi utiliser une version Web de
l’enregistrement de la base de données en définissant le champ Traiter l’URL. Par
le biais de ce champ, le système est informé qu’il doit utiliser la valeur de l’un des
champs précédemment définis dans la requête d’exploration et qui contient l’URL
à afficher. Dans un annuaire de société, par exemple, si une page HTML existe pour
chaque enregistrement et que les liens se présentent toujours sous le même format
(tel que http://soc.entreprise.com/hr/Employe_Jean.html), le système Google Search
Appliance présente les liens correspondant à ces pages avec les résultats.
Bases de données prises en charge :
Le robot d’exploration de base de données du système Google Search Appliance
prend en charge IBM DB2, Microsoft SQLServer, MySQL, Oracle et Sybase. Le
système Google Search Appliance utilise des pilotes de base de données JDBC
natifs fournis par les concepteurs de bases de données. Les pilotes et versions de
base de données pris en charge sont les suivants :
• MySQL: JDBC version 3.0
• Oracle: Oracle JDBC Driver version - 10.1.0.2.0
• Sybase: jConnect (TM) for JDBC(TM)/5.5(Build 25137)/P/EBF10000/JDK12/Sun
Jan 6 21:57:04 2002
• Microsoft SQLServer: JDBC version 2.2
• IBM DB2: JDBC version 8.1
© Copyright 2006. Google est une marque déposée de Google Inc. Tous les autres noms de sociétés et de produits peuvent être des marques
déposées des sociétés auxquelles ils sont associés.
Téléchargement