Chapitre 1
Introduction générale
Le monde de l’informatique a connu une évolution effervescente depuis l’apparition du
premier ordinateur l’EDVAC en 1945 jusqu’à aujourd’hui. Au début de l’ère informatique,
l’utilisation de l’ordinateur s’est limité à effectuer des calculs. Grâce à l’apparition des sup-
ports de stockage comme les bandes magnétiques (Figure 1.1) et les disques durs (Figure
1.2), les informaticiens se sont intéressés à la sauvegarde et à la gestion des données.
FIGURE 1.1 – Bande Magnétique FIGURE 1.2 – Disque dur
Historiquement les premières techniques de gestion des données se basent sur la notion
des chiers. Un chier est une collection d’informations numériques réunies sous le même
nom. On parle alors des systèmes de gestion de chiers (SGF) qui ont été utilisés à partir
des années 50. Vers des années 70 on commence à parler des Systèmes de Gestion des
Bases de Données (SGBD), proposant une philosophie différente de celle des SGFs.
Dans ce chapitre vous allez découvrir les SGFs et leurs inconvénients, les bases de données
et leurs avantages, et les systèmes de gestion des bases de données.
1.1 Quelques concepts de base
Une donnée est une représentation de l’information. Une donnée possède un type et
une valeur. Le type de donnée nit la nature du codage et les opérations autorisées sur
une donnée. Une donnée peut être simple ou complexe. Elle est dite simple si elle est non
décomposable, alors qu’elle est dite complexe si elle est composée de données simples ou
complexes.
1
1.2. L’APPROCHE FICHIER
Faiez CHARFI (ISET Sfax)
2
Systèmes de Gestion des Bases de Données - Notes de Cours
EXEMPLE 1.1.
On pose NCC une donnée pour représenter la note de contrôle continu. NCC est de type
Réel (codée sur 4 octets), les opérations permises sur NCC sont : l’addition, la soustrac-
tion, la multiplication et la division. 12,75 est un exemple de valeur de l’attribut NCC.
EXEMPLE 1.2.
On pose Adr une donnée pour représenter l’adresse d’un étudiant. Adr est de type
chaine de caractères. Un exemple de valeur de l’attribut Adr est : Route Mahdia Km
2,5. Sfax. 3000. TUNISIE. Cette adresse peut être décomposée en un ensemble d’autres
attributs : Rue, Ville, Code postal, et Pays. Par conséquent Adr est une donnée
complexe.
Les données doivent être mémorisées pour pouvoir être exploitées ultérieurement. On dis-
tingue trois mémoires :
La mémoire centrale est une mémoire volatile. Il s’agit de la RAM. Cette mémoire
sert à héberger les programmes en cours d’exécution et leurs données.
La mémoire secondaire est une mémoire permanente. Il s’agit du disque dur. Elle
sert à stocker les données dans des chiers ou des bases de données.
La mémoire tertiaire est une mémoire permanente utilisée pour la sauvegarde. Il
s’agit de disque dur externe, disque optique (CD, DVD), clé USB, etc. Ce type de
mémoire sert généralement à transférer les données ou à les dupliquer pour des
raisons de sécurité.
1.2 L’approche chier
L’approche chier est l’approche traditionnelle. Dans cette approche les données des -
chiers sont décrites dans les programmes. Chaque application se base sur un ou plusieurs
chiers.
EXEMPLE 1.3.
Soit deux applications : Paie et Facturation (Figure 1.3). La Facturation se base sur un
chier Ventes an de pouvoir générer les factures clients, et la Paie permet de cacluler
le salaire des employés en se basant sur leurs salaires de base (chier Salaires) et sur le
pourcentage des ventes réalisées (chier Ventes).
Dans l’exemple 1.3 précédent chacune des deux applications utilise un chier Ventes. On
remarque que ces deux chiers ont été utilisés au lieu d’un seul. Ceci nous renvoie à cer-
tains inconvénients de l’approche par chier.
Systèmes de Gestion des Bases de Données - Notes de Cours
INTRODUCTION GÉNÉRALE Document edité avec L
A
T
EX
3
FIGURE 1.3 – Exemple de l’approche par chier
1.2.1 Inconvénients de l’approche par chier
Les principaux inconvénients de l’approche par chier sont :
Redondance des données : Cette redondance génère certains problèmes, à sa-
voir, la multiplication des tâches de saisies et des mises à jour, la multiplication des
programmes de contrôles, l’augmentation du volume des données sur le support de
stockage physique et l’incohérence des données.
Impossibilité de partager les données entre les applications car elles ne peuvent
pas accéder simultanément aux chiers.
Difcultés d’accès à l’information : Il n’existe pas une seule technique pour ac-
céder aux informations dans un chier. De plus, les chiers ne se trouvent pas for-
cément sur le même support logique ou physique. Il est à noter que le programme
permettant d’extraire une information à partir d’un chier volumineux peut consom-
mer beaucoup de temps pour réaliser cette tâche.
1.2.2 Système de Gestion de chiers
Cette section présente sommairement la notion de gestion de chiers. Tout d’abord, rap-
pelez vous qu’un chier est un ensemble de données semblables physiquement regroupées
sur un support. Un chier est composé d’un ensemble d’articles. Un article est une unité
d’information associée à une instance d’un chier. Par exemple, les informations d’un seul
livre du chier Livre. Un article est composé par un ensemble de rubriques ou de champs.
Par exemple, les articles du chier Livre sont composés des champs :
Code Titre Auteur Editeur Date
La gure 1.4 montre un exemple qui illustre le contenu du chier Livre. Ce chier
comporte trois lignes de données ou encore trois articles.
Le champ CodeLivre permet d’identier un article du chier Livre. Par conséquent, ce
champ est appelé Clé.
Un système de gestion des chiers doit assurer les opérations suivantes :
Création et destruction d’un chier.
Ouverture et fermeture d’un chier.
Insertion, modication et suppression d’un article.
Rechercher un article dans un chier.
1.3. L’APPROCHE BASE DE DONNÉES
Faiez CHARFI (ISET Sfax)
4
Systèmes de Gestion des Bases de Données - Notes de Cours
FIGURE 1.4 – Un exemple de chier de données : Livre.dat
1.3 L’approche base de données
1.3.1 Dénitions
DÉFINITION 1.1.
Une base de données est un ensemble de données qui sont fortement structurées,
persistantes, et dont la structure est dénie dans un schéma. Les données d’une base de
données sont gérées par un système de gestion de base de données.
DÉFINITION 1.2.
Un système de gestion des bases de données est un logiciel spécialisé pour la gestion
automatisée des bases de données.
1.3.2 Les bases de données
L’approche Base de données a été proposée pour résoudre les problèmes de l’approche
par chier, notamment la redondance, l’incohérence, le partage de données et l’accès à l’in-
formation. Une base de données est une collection de données qui peuvent être reliées entre
elles, et qui sont stockées sans redondance inutile. Une base de données peut être utilisée
par plusieurs applications.
Les données doivent être bien structurées pour permettre un développement cohérent des
applications futures, sachant que la structure de stockage des données doit être indépen-
dante des applications. Autrement il y a une séparation entre les données et les traite-
ments. Un utilisateur peut manipuler directement ou via des applications les données sto-
ckées. Cette manipulation consiste à réaliser quatre opérations possibles :
— Insertion
— Modication
— Suppression
— Extraction
La gure 1.5 illustre l’approche par base de données. Selon cette gure vous pouvez remar-
quer que les données sont centralisées, elles sont partagés entre plusieurs applications, et
qu’il n’y a plus redondance.
Systèmes de Gestion des Bases de Données - Notes de Cours
INTRODUCTION GÉNÉRALE Document edité avec L
A
T
EX
5
FIGURE 1.5 – Approche Base de données
1.3.3 Les Systèmes de Gestion des Bases de Données
Un Système de Gestion de Bases de Données (SGBD) est un ensemble de programmes
permettant d’assurer la gestion et le contrôle automatique des Bases de données. Les prin-
cipales fonctions que doit assurer un SGBD sont :
Description : A partir d’une représentation abstraite des données, le SGBD doit assurer
la description de la structure physique des données. Pour effectuer cette description
un SGBD offre un langage de dénition de données (LDD)
Manipulation : La manipulation de données consiste à ajouter,modier,supprimer et
extraire des données. Un SGBD permet de manipuler les données via un langage
de manipulation de données (LMD). L’interrogation de données peut être effec-
tuée d’une manière interactive via le LMD ou bien avec des programmes. Lors de la
manipulation des données le SGBD doit garantir le contrôle d’intégrité des données.
Extraction : Un SGBD permet l’interrogation de la base de données, d’une manière in-
teractive ou via des programmes.
De même un SGBD doit garantir la condentialité des données de la base, et ceci via
le contrôle des autorisations et des droits d’accès des utilisateurs. Il doit assurer qu’une
base de données soit partagée entre plusieurs utilisateurs en même temps et ceci via des
mécanismes de contrôle d’accès concurrents. L’accès concurrent consiste à gérer des
transactions simultanées sur les même lignes de données toute en préservant la cohé-
rence de la base de données.
Les utilisateurs exigent que leurs bases de données soient sécurisées, autrement pas de
risque de perte de données. Pour garantir cette sécurité un SGBD possède des méca-
nismes de reprise après panne et de journalisation permettant d’assurer la continuité
et la restauration l’état des données suite à des pannes éventuelles.
Extraire une information à partir d’une base de données volumineuse est une tâche qui
peut consommer du temps. Pour garantir un accès rapide et performant aux données, un
SGBD utilise des techniques tel que l’indexation, le hashage, les arbre balancés, etc.
1.3. L’APPROCHE BASE DE DONNÉES
Faiez CHARFI (ISET Sfax)
6
Systèmes de Gestion des Bases de Données - Notes de Cours
FIGURE 1.6 – Exemple d’une base de données
EXEMPLE 1.4.
Soit une base de données qui gère les données de scolarité. Cette BD contient une table
dans laquelle sont enregistrées les notes des étudiants par module (Figure 1.6).
Plusieurs utilisateurs peuvent accéder à cette base de données. Cet exemple se limite à
deux étudiants, ayant respectivement les matricules 125621 et 125622, et un
administrateur.
Contrôle d’intégrité : La valeur de la note de Devoir de Contrôle (NDC) doit être
comprise entre 0 et 20.
Contrôle et droit d’accès : Un étudiant ne peut accéder qu’aux lignes de données qui
le concerne. Le SGBD ne l’autorise pas à accéder aux données d’un autre étudiant.
L’accès d’un étudiant à ces propres données s’effectue en mode lecture seule.
L’administrateur peut accéder à toutes les lignes de données des notes des
étudiants. Il a le droit d’ajouter, modier, supprimer et de lire ces données.
Accès concurrent : L’admisitrateur et un étudiant veulent accéder simultanément à
la même ligne de données. L’administrateur veut modier la note de DC et
l’étudiant veut lire toutes ces notes. Une des solution que le SGBD peut effectuer
est de vérrouiller l’accès à la valeur de DC jusuq’à ce que la modication soit
terminée.
Systèmes de Gestion des Bases de Données - Notes de Cours
INTRODUCTION GÉNÉRALE Document edité avec L
A
T
EX
7
1.3.4 Architecture des SGBDs
L’architecture des SGBDs modernes est basée sur l’architecture ANSI 1/SPARK 2. C’est
une architecture fonctionnelle qui s’articule sur trois niveaux : interne, conceptuel et ex-
terne (Figure 1.7).
FIGURE 1.7 – Architecture d’un SGBD
Avec cette architecture il y a une indépendance des données, indépendance logique et
indépendance physique :
Indépendance logique : Les applications des utilisateurs ont des vues différentes des
données. La modication du schéma logique de la base de données par les adminis-
trateurs n’a aucun impact sur les applications et leurs vues (voir Exemple 1.5).
Indépendance physique : Elle consiste à permettre la modication de la structure de
stockage ou les index sans répercussions sur les applications. Ainsi, les disques, les
méthodes d’accès aux données, et le codage des données ne sont pas apparents aux
utilisateurs (voir Exemple 1.6).
EXEMPLE 1.5. (Indépendance logique)
Les données d’un institut ou école : Enseignants, Etudiants, Notes, Livres, Emprunts,
Salle, etc. Chaque application a une vue de la base de données :
Application 1 : Gestion des notes (MatriculeEtd, CodeMod, CodeMat, NNP, NDC,
NDS, Moyenne)
Application 2 : Gestion des Enseignants(NSS, Prenom, Nom, Adr, NumTel1,
NumTel2, Specialité)
Application 3 : Gestion des Livres (CodeLivre, Titre, Auteurs, Editeur,
DateEdit, ISBN)
1. American National Standards Institute
2. Standards Planning And Requirements Committee
1.4. MODÉLISATION DES DONNÉES
Faiez CHARFI (ISET Sfax)
8
Systèmes de Gestion des Bases de Données - Notes de Cours
EXEMPLE 1.6. (Indépendance physique)
Structure Logique : {Nom, Prénom, Adresse, Fonction, Enfants {Prénom,
Age}}
Structure Physique : Un seul chier, ou deux chiers Employé et Enfant, reliés par
des pointeurs.
1.3.5 Exemples de SGBDs
Le tableau suivant illustre les SGBDs les plus populaires sur marché.
Nom Logo Editeur Licence
ORACLE Database Oracle Propriétaire
MySQL Oracle & MySQL AB GPL
PostgreSQL GPL
SQLite GPL
SQLServer MicroSoft Propriétaire
MicroSoft Ofce Access MicroSoft Propriétaire
OpenOfce Base Oracle LGPL
LibreOfce Base The Document Foundation LGPL
1.4 Modélisation des données
La modélisation conceptuelle est une phase importante pour réussir une application de
base de données. Une application de base de données réfère à la base de données et les
applications qui y sont associées. Dans cette section, vous allez découvrir les différentes
étapes nécessaires pour concevoir les données, les différents types de modèles de données,
et un aperçu sur le modèle Entité/Association.
1.4.1 Modèles de données
La gure 1.8 illustre les principales phases de modélisation de données. Avant la concep-
tion et l’implémentation d’une application de bases de données, il est nécessaire d’effectuer
des interviews avec les utilisateurs de l’application future. C’est l’étape d’analyse et de cap-
tures des besoins. Ces interviews permettent de savoir quel est le besoin en information
Systèmes de Gestion des Bases de Données - Notes de Cours
INTRODUCTION GÉNÉRALE Document edité avec L
A
T
EX
9
et quels sont les règles utilisées pour traiter les informations et pour réaliser les calculs.
A partir de cette étape on peut déterminer le besoin de données, qui est une sorte de dic-
tionnaire de données dans lequel on trouve les descriptions de données récoltées {Attribut,
Type, Taille, Description, Contrainte}.
Après la phase d’analyse on passe par trois étapes de modélisation : Conceptuelle, Logique
et Physique. Un modèle de données correspond à chacune de ces étapes.
FIGURE 1.8 – Principales phases de la conception des données
Modèle Conceptuel de Données (MCD) : Ce modèle est obtenu à partir des besoins de
données collectées après la phase de l’analyse et capture des besoins. Le MCD est
une description concise des données requises par les utilisateurs. Le MCD inclut une
description détaillée des Entités, des relations entre elles et des contraintes.
Il existe plusieurs formalismes permettant de créer un MCD : Entité/Association
(E/A), UML, MERISE, SADT/SART, OMT, etc.
Modèle Logique de Données (MLD) : Après avoir conçu les données il faut les implé-
menter sur un SGBD. La modélisation des données dans un SGBD peut être selon
l’un des modèles :
— Réseau
— Hiérarchique
— Relationnel
— Objet
1.4. MODÉLISATION DES DONNÉES
Faiez CHARFI (ISET Sfax)
10
Systèmes de Gestion des Bases de Données - Notes de Cours
La plupart des SGBDs modernes se basent sur la modélisation relationnelle ou la
modélisation objet. Le type de modèle qui va être utilisé dans cet ouvrage est le mo-
dèle relationnel. Le Modèle Logique de Données est la traduction du MCD en vue de
l’implémenter dans un SGBD.
Modèle Physique de Données (MPD) : Ce modèle est obtenu dans la phase de modé-
lisation physique, qui consiste à spécier la structure de stockage, les index, les che-
mins d’accès, et les paramètres de la base de données.
EXEMPLE 1.7. Cet exemple illustre les deux modèles conceptuel et logique des
données. Pour la modélisation conceptuelle, deux formalismes sont présentés :
Entité/Association et UML. Le modèle logique est présenté sous forme de modèle
relationnel.
MCD
UML Entité/Association
MLD
Acteur (NumActeur, NomActeur, PrenomActeur)
Film (NumFilm, Titre, Réalisateur, Producteur, Catégorie)
Joue (#NumActeur,#NumFilm, Rôle)
1.4.2 Modèle Entité/Association
Le modèle Entité/Association (E/A) décrit les données en tant que Entités, Associations
et Attributs (Figure 1.9).
FIGURE 1.9 – Le modèle Entité/Association
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !