Google Search Appliance - Robot d’exploration de base de données Aperçu des fonctionnalités Présentation Le nouveau robot d’exploration de base de données du système Google Search Appliance permet d’accéder aux informations stockées dans les bases de donnés des entreprises, et d’effectuer des recherches complètes et globales que les données soient structurées ou non. Grâce à ce robot d’exploration, les utilisateurs accèdent à des données professionnelles qui sont stockées dans des systèmes de gestion de documents, dans des applications d’entreprise ou dans des systèmes de base de données personnalisés. Tout contenu stocké dans des bases de données relationnelles d’entreprise standard peut être inclus dans les recherches. Recherche de contenu SPÉCIFICATIONS Bases de données prises en charge : IBM DB2 Microsoft SQLServer MySQL Oracle Sybase Le robot d’exploration de base de données du système Google Search Appliance utilise le langage normalisé SQL (Structured Query Language) afin de déterminer les informations à extraire de la base de données. Pour configurer la connexion à une base de données, l’administrateur du système de recherche commence par définir les informations de connexion, notamment le nom d’hôte et le port de la base de données, le nom de la base et les informations d’identification d’accès (nom d’utilisateur et mot de passe). Il définit ensuite la requête d’exploration qui est une instruction SQL permettant de récupérer les informations souhaitées dans la base de données. Google Search Appliance Exemple : Matériel : version 4.0 ou ultérieure Logiciel : version 4.2 ou ultérieure Pour une base de données « employee » contenant les champs : employee_id, first_name, last_name, email, dept CONTACTS La requête d’exploration peut se présenter comme suit : SELECT employee_id, first_name, last_name, email, dept FROM employee www.google.fr/enterprise Adresse e-mail [email protected] Cette requête permet de récupérer l’ensemble des informations de la base relatives aux employés qui correspondent aux critères indiqués dans la requête. Ces informations sont extraites de la base de données pour être ensuite importées dans le système Google Search Appliance où elles sont indexées. L’utilisation de requêtes d’exploration incrémentielles permet à l’administrateur de définir une instruction SQL qui cible les insertions, les mises à jour et les suppressions effectuées dans la base de données afin que le contenu soit en permanence actualisé et enrichi. L’administrateur est en mesure de sélectionner avec précision les champs à explorer et peut facilement exclure certains champs de l’exploration ou des résultats de recherche renvoyés. Indexation d’enregistrements La requête d’exploration (telle que définie ci-dessus) génère un ensemble d’enregistrements qui sont exportés vers le système Google Search Appliance pour être indexés. Le système convertit ensuite chaque enregistrement de la base de données en document HTML par le biais d’une feuille de style XSLT. L’administrateur peut, par défaut, utiliser la feuille de style qui génère un tableau résumant clairement les paires nom/valeur pour chaque enregistrement. L’administrateur peut alternativement appliquer une feuille de style personnalisée afin de formater les informations selon les besoins. Grâce à l’utilisation de la norme XSLT, l’administrateur peut formater l’enregistrement de la base de données de la façon la plus adaptée à chaque utilisateur, notamment en générant des balises META pour des recherches spéciales et limitées. GOOGLE SEARCH APPLIANCE Traitement des résultats Une fois le contenu de la base de données indexé, les utilisateurs peuvent y effectuer des recherches. Dans la mesure où le système Google Search Appliance assure la maintenance d’un index unifié de l’ensemble du contenu de l’entreprise, les utilisateurs ne sont pas contraints d’utiliser une interface distincte en fonction de la base où résident les données. L’administrateur du système de recherche peut autoriser les recherches dans un ensemble de données unique ou dans l’intégralité du contenu de l’entreprise par le biais des collections illimitées du système Google Search Appliance. L’administrateur peut également choisir la manière dont sont affichés les résultats lorsqu’un utilisateur effectue une recherche avec le système Google Search Appliance et sélectionne un résultat dans la base de données. Il peut ainsi définir une requête de traitement qui extrait l’enregistrement le plus récent pour un résultat donné et lui applique la feuille de style précédemment définie pour l’affichage. Exemple : Requête de traitement : SELECT employee_id, first_name, last_name, email, dept FROM employee WHERE employee_id = ? Champ de clé primaire pour cet exemple : employee_id L’administrateur du système de recherche peut aussi utiliser une version Web de l’enregistrement de la base de données en définissant le champ Traiter l’URL. Par le biais de ce champ, le système est informé qu’il doit utiliser la valeur de l’un des champs précédemment définis dans la requête d’exploration et qui contient l’URL à afficher. Dans un annuaire de société, par exemple, si une page HTML existe pour chaque enregistrement et que les liens se présentent toujours sous le même format (tel que http://soc.entreprise.com/hr/Employe_Jean.html), le système Google Search Appliance présente les liens correspondant à ces pages avec les résultats. Bases de données prises en charge : Le robot d’exploration de base de données du système Google Search Appliance prend en charge IBM DB2, Microsoft SQLServer, MySQL, Oracle et Sybase. Le système Google Search Appliance utilise des pilotes de base de données JDBC natifs fournis par les concepteurs de bases de données. Les pilotes et versions de base de données pris en charge sont les suivants : • MySQL: JDBC version 3.0 • Oracle: Oracle JDBC Driver version - 10.1.0.2.0 • Sybase: jConnect (TM) for JDBC(TM)/5.5(Build 25137)/P/EBF10000/JDK12/Sun Jan 6 21:57:04 2002 • Microsoft SQLServer: JDBC version 2.2 • IBM DB2: JDBC version 8.1 © Copyright 2006. Google est une marque déposée de Google Inc. Tous les autres noms de sociétés et de produits peuvent être des marques déposées des sociétés auxquelles ils sont associés.