Système de Gestion de Base de Données (SGBD) A – Introduction - Qu’est-ce qu’on entend généralement par BASE DE DONNEES ? - Petit historique - Vers la structuration des données - Quelques exemple de bases connues (Sécu Sociale, Fichiers d’inscription des étudiants, …) - Une base de données est généralement associée à des services (requêtes, formulaires, …) - Quelques mots de vocabulaire : Enregistrements, champ, entête, type et format des données (exemple détaillé : fichier de notes) - Codage ASCII Système de Gestion de Base de Données (SGBD) A-1 – Vers la notion de base de données (vision des étudiants) Système de Gestion de Base de Données (SGBD) A-2 – Quelques exemples de bases de données identifiables • • • • • • • • • • • • • • Coordonnées bancaires (dès le 19 ème siècle) Compagnies de téléphone Clients/fournisseurs Décomptes (Haute Egypte) Horaires des train et réservations de billets Fiches de police – Carte d’identité, Passeport, … Sécurité Sociale (vers 1946 avec fiches support papier, fichiers boîtes) puis ordinateurs et fichiers (N° INSEE) Premier ordinateurs commandés par les USA pour applications civiles : UNIVAC recensement de 1950 Google, Yahoo et autres « moteurs de recherches » Face book (et ses dangers) Loi informatique et liberté de 1976 Apogée et tous les fichiers gérant l’inscription, les droit et les notes des étudiants à l’université Edwige (un projet avorté?) Chaque français en moyenne est enregistré dans une centaine de BdeD Système de Gestion de Base de Données (SGBD) A-2 – Quelques exemples de bases de données identifiables L’Univac (1951) Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données - Création d’une petite table au format texte avec séparateur de champs « ; » Importation du fichier dans EXCEL Rappels sur l’utilisation d’EXCEL Adressage relatif et adressage absolu Application de fonctions simples (concaténation, SI, …) Etendre une formule Les fonctions base de données d’EXCEL et les limites d’EXCEL - Filtre automatique - Recherche d’information et tris simples - Formulaire - Validation des données (limiter les entrées, messages de saisie et d’erreur) - Filtres élaborés, critères, zones de critères, ET / OU - Extraction d’un sous ensemble d’une base - Fonctions base de données (BDMOYENNE,…) -Exportation d’une base au format texte avec séparateur tabulation et point virgule Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Exemple : notes des étudiants (http://www.cristal.u-psud.fr/DBGEOL/FTP_files/notes.txt) Fichier texte ASCII (notes.txt) support portable universel Chaque enregistrement (lignes) contient un nombre défini de champs (colonnes) Le caractère « ; » est ici le séparateur de champs Cette (petite) base de données est constituée d’éléments ordonnés de façon bien repérable dont l’ordre est donné par la première ligne (=entête). L’entête contient l’identificateur des champs [field] de chaque enregistrement [record]. ;;=pas d’info pour ce champ > Ceci ne constitue pas une erreur. On ne dispose pas de l’information relative à la valeur de ce champ pour cet enregistrement Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Exemple : notes des étudiants Fichier texte éditable avec un éditeur de texte, tel bloc note Une base de données ne reflète pas la réalité, c’est une vision des choses. De plus, il existe toujours une grande probabilité de présence d’erreurs de frappe ou liées à une information biaisée, mal reportée, mal acquise ou d’erreur intentionnelle. Identificateurs des champs Nom;Prénom;matière;coef;note Entête Bach;andré;environnement;3;10 Enregistrements Ravel;claire;environnement;3;19,5 Schubert;francine;environnement;2;9,5 Vivaldi;Stéphane;environement;3;14 Champs Erreur Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Format Texte ASCII (étendu) (American Standard Code for Information Interexchange) Type de codage standard, adopté dans les années 60, qui fait correspondre un caractère (lettre, chiffre, ponctuation,…) à un code numérique . Code numérique = mot machine = byte C’est la plus petite structure qui entre dans l’architecture des ordinateurs. Chaque « mot » contient 8 cases (bits) dans un codage binaire composé de 1 ou 0 dans chaque case (1 : le courant électrique passe ou 0 : il ne passe pas). Le codage de caractères sur 8 bits autorise 256 caractères Exemple Le caractère A correspond au code 65 décomposé en binaire de la façon suivante : Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Format Texte ASCII (étendu) (American Standard Code for Information Interexchange) Avec ce codage sur 8 bits, il y a 256 possibilités de codage binaire On a déjà besoin de : ‘a’ -> ‘z’ (26 caractères) ‘A’ -> ‘Z’ (26 caractères) 0 -> 9 (10 caractères) Signes de ponctuation (au moins 10 caractères) Opérateurs arithmétiques (+, -, /, *,^,…) (environ 20 caractères) &, %, $,… (25 caractères) CTRL C, CTRL X,… Etc… Une information c’est 1 ou plusieurs (maximum 4 en général) mots machine. Les informations sont traitées par des programmes informatiques dédiés. Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Code ASCII Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Quelques types de données que nous allons rencontrer Chaine de caractère (255 caract. max), ex : ‘Ecologie’ Entier court 0 -> 255 ou -128 -> +127 Entier long 0 -> plusieurs milliards Réels (décimal séparé par un point pour les versions anglo-saxonnes et par une virgule pour les versions latines) Caractère ‘a’ -> ‘z’ et ‘A’ -> ‘Z’ Booléen ‘O’, ‘N’, (0,1), ‘F’, ‘T’ Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données - Un premier exemple utilisant les fonctions BD d’EXCEL : fichier de notes Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Format base de données sous Excel Données Filtre automatique Filtre >> critères (2 ici) Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Liste déroulante : - éviter fautes de frappes - assurer la sécurité d’une information répétitive - confort de la saisie des données. Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Conditions logiques (ou expressions logique s/ booléennes) Requête : Sélectionner et afficher les notes d’anglais et de géologie qui sont inférieures à 7 ou supérieures à 15 Code couleur : Opérateur logique Comparateur (matiere = « anglais » OU matiere = « geologie ») ET (note sur 20 < 7 OU note sur 20 > 15) Equivalent à : [matiere = « anglais » ET (note sur 20 < 7 OU note sur 20 > 15)] OU [matiere = « geologie » ET (note sur 20 < 7 OU note sur 20 > 15)] Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Filtre élaboré : niveau de requêtes plus performantes - filtrant les données - répondant à des critères plus ou moins complexes à définir - faisant appel à la logique et/ou au calcul. Système de Gestion de Base de Données (SGBD) B – Premier contact avec la notion de base de données Version Access: on a ainsi mis en scène beaucoup de fonctionnalités d’une base de données Access Système de Gestion de Base de Données (SGBD) C – Allons plus loin Bases de données ? Collection d’informations structurées Support de différents formats d’information Information : texte ou autre - Texte pur (ASCII) > portable : latin (non accentué) - Numérique (entiers, réels, complexes,…) - Chaînes de caractères (articles) - Autres (images, sons, …) Ex : sécurité sociale Numéro – nom – prénom – sexe –date de naissance - historique Sujet – Thématique donnée orientation de la réalisation de la base en fonction de son utilité dans la thématique donnée (scientifique et technique / économique / juridique / autre) Cohérence des informations Règles de collection Système de Gestion de Base de Données (SGBD) C – Allons plus loin SGBDR Une base de données peut être mise sous forme d'un fichier texte mais c'est souvent insuffisant pour l'usage que l'on en fait Les systèmes (+/- complexes) qui permettent de gérer les données sont des Systèmes de Gestion de Bases de Données Relationnelles Plusieurs bases de données (par internet) peuvent être reliées entre elles (fichiers clients) Une base de donnée de plusieurs millions d'entrées peut tenir dans une clé USB Système de Gestion de Base de Données (SGBD) C – Allons plus loin LOGIQUE MATHS Entreprises Bon sens Intuition Logique élémentaire Méthodes informatique MERISE Système de Gestion de Base de Données (SGBD) D - Base de données : à la fois un outil et un concept Une base de données est à la fois un outil et un concept 1/ Collecter/Rassembler des données (informations) [datas/informations] Une base est une collection de données [data collection] Différents types de données : • Valeur numérique [value] ex. quantité, prix, concentration de polluant • Texte (!!! format du texte) • Images et autres fichiers (son, .doc) [data file] • Liens (adresse du doc) [link] • Autres types Système de Gestion de Base de Données (SGBD) D - Base de données : à la fois un outil et un concept 2/ Organisation des données collectées • • • • Trier Mettre en catégorie Hiérarchiser en fonction de différents critères (ex. confiance) Formater (= mettre au même format) 3/ Exploiter la collection • • • • Lier les données entre elles Rechercher de l’information ± précise Requête conditions logiques + fonctions spécialisées Rapport / Etat des lieux, des connaissances avec d’autres fonctions spécialisées (ex. résumer de la situation) statistiques et fonctions statistiques Système de Gestion de Base de Données (SGBD) D - Base de données : à la fois un outil et un concept 4/ • • • Interfaçage Facilite l’utilisation et l’accès Accessibilité aux différentes parties et fonctionnalités de la base Ergonomie du logiciel 5/ Localisation • Diffusion / Accessibilité (ouverture au public, ex. IFREMER) identifier les clients • Espace disque (ou autre support, ex. CDROM) ou serveur (Internet ; Intranet / Réseau local) • !!! Taille de la base : compressée ou pas / divisée ou pas 6/ Accès • Autorisation d’accès : – Niveaux d’accès / d’utilisation – Compte utilisateur identificateur + mot de passe • Responsable : Administrateur de la base Système de Gestion de Base de Données (SGBD) D - Base de données : à la fois un outil et un concept 7/ • • • • • • Services En complément / annexe, en connexion avec la base de données Interfaçage web (ex. google map) Téléchargement de documents (ex. doc technique, cours, articles, liens, prestations, images,…) Outils informatiques performants Action à distance Autres 8/ • • • • Ce qui est associé à la notion de base de données Flux de données Performance de la base Test (avec échantillon de données) de la base Mises à jour Système de Gestion de Base de Données (SGBD) E – Quelques définitions - Une base de données c’est essentiellement une collection structurée d’informations du même type. - Une base est constituée d’au moins une table - Dans chacune des tables les informations sont contenues dans des enregistrements. Chaque enregistrement (ou ligne) est subdivisable en différents champs (colonnes) caractérisés par une étiquette, un type (texte, numérique, …) et un format de contenu. - La base est généralement associée à un ensemble de services : - Recherche, requêtes, formulaires, règles de protection… - Une base de donnée est destinée à être utilisée - Il faut la protéger avant de la diffuser - On entre généralement les données à l’aide d’un formulaire ou par importation (fichier texte) - On peut exporter les données en différents formats - Plutôt que d’appliquer des règles de logique élaborées ou de mathématique, il faut savoir faire preuve de bon sens