Bases de données

Téléchargement

Bases de données

PTSI Lycée Eiﬀel

28 février 2014

Introduction

Pour ce troisième chapître, nous allons mettre de côté notre apprentissage de Pyhton pour nous

intéresser à un sujet fondamental dans l’informatique actuelle : les bases de données. La gestion

eﬃcace d’énormes quantités de données est une problématique essentielle pour tous ceux qui tra-

vaillent en lien avec Internet (songez au fonctionnement d’un moteur de recherche comme Google

par exemple), mais aussi, à plus petite échelle, pour les futurs ingénieurs que vous serez : comment

traiter de façon eﬃcace des données numériques issues de batteries de tests et accéder le plus ra-

pidement possible aux informations pertinentes ? Les bases de données sont en soi un concept très

simple : il s’agit d’organiser des données de façon à en optimiser le traitement, c’est-à-dire en gros

les mises-à-jour et les recherches. Le but de ce chapître n’est pas de devenir un spécialiste technique

des bases de données (nous n’apprendrons pas vraiment comment fonctionne une bases de données

« en interne »), mais plutôt d’en devenir un utilisateur expert.

La première utilité des bases de données est très simple : stocker des données. Certes, mais on

dispose déjà pour cela sur notre cher ordinateur d’un système de ﬁchiers qui, utilisé correctement,

est un outil assez eﬃcace dans ce domaine. Le fonctionnement d’une base de données est subtilement

diﬀérent. En gros, le système de ﬁchiers se contente de gérer l’organisation des données (et encore,

de façon assez simpliste). Si on souhaite simplement accéder aux données en question, on le fera en

« ouvrant » le ﬁchier, c’est-à-dire en accédant aux données du ﬁchier à l’aide d’un logiciel externe. De

même pour toutes les mises-à-jour de données. Quant aux recherches au sein du système de ﬁchiers,

elles sont quasiment inexistantes puisqu’on ne peut en gros faire que des recherches portant sur le

nom du ﬁchier.

Déﬁnition 1. Une base de données est une structure gérant la collecte, le stockage, les mise à

jour et l’accès à un (gros) ensemble de données. Cette structure permet en particulier d’optimiser les

mises à jour et les recherches, de sécuriser le système de données, et de gérer les priorités d’accès et

les éventuels conﬂits en cas de travail à plusieurs sur les mêmes données

Remarque 1.En fait, la base de données à proprement parler n’est constituée que des données, et le

système complet devrait être appelé plus proprement système de gestion de bases de données

(SGBD en abrégé), mais on fait fréquemment la confusion entre les deux. Nous continuerons à utiliser

le terme générique base de données tout au long du chapître.

Travailler avec des bases de données peut se faire de bien des façons diﬀérentes. On peut en gros

distinguer les diﬀérents types d’utilisation suivants :

•utilisateur « naïf » : se contente d’eﬀectuer des recherches dans la base de données.

•utilisateur « actif » : eﬀectue des recherche mais également des mises à jour (création,

modiﬁcation, destruction de données) sur la base.

•administrateur : gère (et éventuellement écrit) les programmes sous-jacents dans la struc-

ture de la base de données.

•concepteur : décide de l’organisation de la base de données avant son implémentation

informatique.

Nous nous contenterons cette année d’essayer de maîtriser, dans un premier temps, le rôle de

concepteur de bases de données (qui est tout à fait théorique, on peut très bien eﬀectuer le travail

correspondant « sur papier »), puis celui d’utilisateur actif. Nous laisserons par contre de côté la

plupart des aspects techniques aﬀérents au travail de l’administrateur. Autrement dit, nul besoin de

savoir programmer dans ce chapître, les seuls éléments de langage informatique que nous apprendrons

seront ceux permettant d’eﬀectuer des requêtes (en gros des recherches) dans notre base de données.

1 Construction d’une bases de données : modèle entité/associations

L’étape de conception d’une base de données est primordiale. En eﬀet, une fois la structure de la

base créée, et un grand nombre de données insérées, il est extrêmement délicat de la modiﬁer. Il faut

donc bien réﬂéchir à l’organisation des données avant même de créer la base. Pour cela, on dispose

de plusieurs façons de représenter les choses (ce qu’on appelle des modèles), nous en étudierons deux

dans ce cours. Pour vous donner une base de réﬂexion, prenons l’exemple suivant (qui nous servira

dans tout le chapître : vous décrochez un petit boulot de stagiaire pour l’été prochain chez Alloc**é

(pas de pub !), et vous êtes en charge de la base de données du site. Bien évidemment, vous n’aurez

pas à concevoir vous-même la base, mais imaginez le travail nécessaire pour organiser intelligemment

des centaines de milliers de données : quels sont les éléments qu’on a envie de connaître pour chaque

ﬁlm, chaque acteur, chaque réalisteur ? Comment les relie-t-on entre eux ? Si on veut que la base de

données puisse nous sortir facilement, par exemple, la liste de tous les westerns des années 50 dont l’un

des trois rôles principaux est tenu par une femme, comment fera-t-on ? Pour ce dernier point, c’est

la base de données qui gère, mais encore faut-il qu’elle soit conçue de façon rationnelle. Mais avant

de nous lancer dans le cinéma, donnons un exemple de liste de données (je ne parle volontairement

pas ici de base de donnée) dans un autre domaine, qui va nous fournir un bon exemple de ce qu’il

ne faut surtout pas faire, et justiﬁer par ce biais l’abandon d’un simple système de ﬁchiers pour une

structure mieux organisée.

Année Vainqueur Nationalité Finaliste Nationalité Sets

2013 Nadal Espagnol Ferrer Espagnol 3

2012 Nadal Espagnol Djokovoc Serbe 4

2011 Nadal Espagnol Federer Suisse 4

2001 Kuerten Brésilien Corretja Espagnol 4

1999 Agassi Américain Medvedev Ukrainien 5

1983 Noah Français Wilander Suédois 3

2013 S.Williams Américaine Sharapova Russe 2

Comme les plus sportifs d’entre vous l’auront compris, il s’agit d’une liste partielle de ﬁnales du

tournoi de tennis de Roland-Garros. La liste pourrait bien sûr être beaucoup plus étendue, mais on

peut déjà constater sur ce maigre échantillon les problèmes que va poser cette organisation :

•il y a une redondance manifeste d’informations : inutile de préciser huit fois que Nadal est

espagnol, une seule suﬃrait. Cela risque d’ailleurs de poser des problèmes en cas de mise à

jour : si Nadal décide soudain de se faire naturaliser qatari, il faudra bien le signaler sur toutes

les lignes où il apparait.

•le classement des lignes n’est pas évident. J’ai choisi de mettre les Dames à la ﬁn (ce n’est

pas très galant) mais j’aurais pu faire autrement. Et si je cherche des informations sur la

ﬁnale Hommes 2013, comment savoir quelle ligne est la bonne puisqu’il y en a deux qui sont

numérotées ainsi ? Bien sûr, c’est un problème très mineur sur une liste aussi courte que celle-ci,

mais imaginez une vraie base de données contenant le même genre d’informations pour tous

les tournois de la saison, il faudra très vite organiser les choses un peu mieux.

•autres soucis de mise à jour : si je décide de supprimer une édition pour une raison ou pour

une autre, par exemple 1999 parce qu’Agassi a avoué s’être dopé et que je n’en veux plus dans

ma liste, je risque de détruire en même temps d’autres informations que je souhaiterais garder

(le pauvre Medvedev qui n’y est pour rien va disparaitre du même coup).

•et si je veux insérer mon tennisman préféré, Jo-Wilfried Tsonga, dans la liste ? Ah ben je ne

peux pas, il n’est jamais allé en ﬁnale de Roland-Garros !

Bref, ça ne va pas du tout. Une façon assez logique de résoudre le problème serait de présenter

non pas une seule liste de données, mais deux : une pour les ﬁnales, avec l’année, le nombre de sets

et les deux protagonistes, et une autre contenant une liste de joueurs et joueuses avec toutes les

données personnelles que l’on souhaite avoir sur eux. Il ne restera plus alors qu’à essayer de faire un

lien entre les joueurs apparaissant dans la liste des ﬁnales, et la liste des joueurs. C’est exactement

le genre de choses que va nous permettre de réaliser le premier modèle que nous allons étudier, le

modèle Entité/Association.

Déﬁnition 2. Une entité est un objet, une personne, un concept, etc, identiﬁable et pertinent dans

le cadre de notre base de données.

Dans notre exemple cinématographique, une entité peut ainsi très bien être un ﬁlm, un réalisateur,

un festival, ou bien d’autres choses. Le concept reste assez vague, mais l’idée est qu’une entité pourra

correspondre à une ligne d’un tableau dans notre base de données. Le principe de l’identiﬁcation

est extrêmement important : il faut pouvoir identiﬁer de façon certaine et unique chaque entité.

On devra pour cela disposer d’une caractéristique appelée clé primaire qui doit être unique. Par

exemple, dans une liste de ﬁlms, il serait dangereux d’utiliser le titre du ﬁlm comme clé primaire, car

on peut imaginer deux ﬁlms diﬀérents ayant le même titre (et cela va compliquer le fonctionnement

de la base). Pour éviter ce problème, on prendra très souvent comme clé primaire un identiﬁcant

artiﬁciel, souvent un numéro d’identiﬁcation.

Une entité contiendra également en général plusieurs attributs, caractéristiques enregistrées

dans la base de données (pour nos ﬁlms, on peut imaginer comme attributs le titre, le réalisateur, la

date de sortie, la durée, le genre, et quantité d’autres), qui prendront leur valeurs dans des domaines

spéciﬁés à l’avance (ainsi, le titre d’un ﬁlm sera une chaîne de caractères, sa durée un entier etc. On

commence à se rapprocher de la notion de variables typées dans un langage de programmation).

Une entité est déﬁnie par son nom, ses attributs, et sa clé primaire (qui est en général un des

attributs). On la représentera de la façon suivante :

Nom

Clé primaire

Attribut2

Attribut3

Remarque 2.Les plus attentifs d’entre vous auront remarqué que j’entretenais une certaine confusion

au sujet de la notion d’entité. Je vous ai dit un peu plus haut qu’une pouvait être un ﬁlm ou un

réalisateur, alors que dans la déﬁnition ultérieure, une entité semble plutôt être un concept abstrait

général, comme « ﬁlm » ou « réalisateur », et pas un cas particulier de ce concept. En fait, on parle

de type d’entité pour désigner le concept général, l’entité en étant bien un cas particulier. On dit

également qu’un ﬁlm particulier sera une instance du type d’entité « Film » (ce que j’abrégerai

souvent, et très improprement, en parlant d’instance de l’entité « Film »). Un exemple plus concret

de (type d’) entité pour ﬁnir :

Acteurs

n˚id

Nom

Prénom

Date de naissance

Nationalité

Déﬁnition 3. Une association est un lien entre deux entités.

Remarque 3.Voila encore une déﬁnition bien ﬂoue. Techniquement, une association entre deux entités

E1et E2est simplement un sous-ensemble de E1×E2. Ainsi, si on dispose d’une entité Film et d’une

entité Acteurs, on pourra créer une association « Joue » qui relie à un ﬁlm tous les acteurs ayant un

rôle dans le ﬁlm.

Déﬁnition 4. La cardinalité d’une association est constituée de deux couples d’entiers (i, j), re-

présentant le minimum et le maximum d’éléments de E1associés à un élément donné de E2(et

vice-versa).

Lorsqu’on réalise un schéma d’une base de données dans le modèle Entité/Association, les entités

sont représentées par des rectangles, comme on l’a déjà vu, et les associations par de simples segments

reliant les deux entités. On indique aux extrêmités du segment les deux couples constituant la

cardinalité sous la forme i..j. Dans le cas où il n’y a pas de maximum, on notera un nà la place du

j. Ainsi, une association de type 1..1associe à tout élément de la première entité un unique élément

de la deuxième, alors qu’une association de type 0..n peut associer à un même élément plusieurs

éléments, ou même aucun. si on reprend notre exemple initial sur Roland-Garros, avec une entité

Finales et une entité Joueurs, on les relierait par une association de type 2..2dans le sens Finales ⇒

Joueurs (deux joueurs, ni moins ni plus, pour chaque ﬁnale), et de type 0..n dans le sens Joueurs ⇒

Finales (un joueur peut ne jamais avoir atteint la ﬁnale, et au contraire avoir participé à plusieurs

ﬁnales). Pour reprendre un exemple plus cinématographique, on peut désormais relier notre entité

Film et notre entité Acteurs et le représenter de la façon suivante (on peut se poser des questions

existentielles concernant les cardinalités : un ﬁlm peut-il ne pas avoir d’acteurs ? Un acteur peut-il

ne jouer dans aucun ﬁlm ? Il est important de répondre à ces question au moment de la conception

de la base sous peine d’avoir de gros problèmes ensuite si on tombe sur un cas ne rentrant pas dans

le cadre prévu) :

Film

n˚ﬁlm

Titre

Durée

Année de sortie

Genre

1..n

Acteurs

n˚id

Nom

Prénom

Date de naissance

Nationalité

Le modèle que nous venons de présenter est très simple mais suﬃsant pour schématiser raison-

nablement des bases de données pas trop complexes. On peut ajouter une ou deux précisions pour

compléter un peu la description que nous venons de faire :

Déﬁnition 5. Une entité donnée est une entité faible d’une autre entité si elle est en lien de

cardinalité 1..1 (dans le sens entité faible ⇒entité forte) et 1..n avec cette dernière.

Le plus simple pour comprendre ce concept est de voir ce qui se passe sur un exemple : dans

notre base de données cinéma, on crée une entité Cinéma visant à compiler la liste des complexes

cinématographiques, et une entité Salle qui se restreindra à une seule salle à la fois. On a une

association logique entre les deux entités (l’appartenance de la salle à un cinéma donné) qu’on peut

classiquement représenter ainsi :

Cinéma

n˚cine

Nom

Ville

Adresse

Type de cinéma

1..n

1..1

Salle

n˚salle

Nombre de places

Type de projecteur

Qualité du son

Cette présentation est toutefois peu adaptée, notamment en ce qui concerne l’identiﬁcation des

salles, puisqu’on doit alors numéroter les salles (toutes les salles de tous les cinémas) de façon unique,

et donc indépendante du cinéma de rattachement. Il serait plus cohérent d’avoir une numérotation

des salles internes à chhaque cinéma. On peut régler ce problème en rajoutant dans l’entité Salle un

attribut n˚cine (identique à celui présent dans l’entité Cinéma) et considérant que la clé primaire

de l’entité Salle est constituée du couple (n˚cine, n˚salle). On peut alors représenter le lien de façon

particulière sur notre schéma pour indiquer cette caractéristique « entité faible ». Nous ne le ferons

pas en général, mais nous garderons cette notion à l’esprit dans notre prochaine partie.

Une autre question qu’on peut naturellement se poser : est-il possible de créer des associations

entre trois entités (ou plus) au lieu de deux ? Oui, bien sûr ! Mais le schéma va devenir compliqué,

notamment au niveau de la représentation des cardinalités. Il est en fait plus pertinent dans ce cas

de créer une nouvelle entité correspondant à l’association. Nous verrons un cas concret un peu plus

bas (dans ce cas, en général, la clé primaire de cette nouvelle entité sera constitué du regroupement

de toutes les clés primaires des entités qu’elle relie).

Malgré tous nos eﬀorts, le modèle Entité/Association reste assez limité, notamment parce qu’il

impose de faire énormément de choix au moment de la conception. On peut très représenter un

lien comme une association ou comme une entité à part, sans que l’une des deux possibilités ne soit

manifestement supérieure. Par ailleurs, il ne fait pas apparaitre les contraintes d’intégrité, c’est-à-

dire les liens « logiques » entre les entités ou leurs attributs. Dans l’exemple que nous allons développer

ci-dessous, rien n’interdit dans notre schéma de créer deux cours avec des classes diﬀérentes et des

professeurs diﬀérents, mais ayant lieu dans la même salle à la même heure !

Pour terminer notre étude de ce premier modèle, essayons de créer un schéma Entité/Association

représentant (sans trop rentrer dans les détails) l’organisation du lycée Eiﬀel. On peut raisonnable-

ment penser penser aux entités suivantes :

•Professeur (commençons par le plus important), avec comme attributs nom, prenom, matiere

(on se restrein volontairement pour l’exemple à un nombre d’attributs limité).

•Eleve, avec comme attributs nom, prenom, date de naissance.

•Classe, avec comme attributs nom, eﬀectif.

•Salle, avec comme attributs numero, capacite, tableau (type de tableau présent dans la salle).

Il faudra bien sûr ajouter des numéros d’identiﬁcation un peu partout pour servir de clés primaires,

et surtout des associations. Il peut paraitre logique de lier les professeurs et les élèves aux classes,

mais ce n’est pas forcément si pertinent que cela, car il faudra de toute façon créer une association

« Cours » qui reliera simultanément un professeur, une salle, et une classe. En tant qu’association

ternaire, on va plutôt la transformer directement en entité. Du coup, on reliera directement les profs,

les salles et les classes à l’entité Cours, et seulement les élèves (en tant qu’entité faible si on admet

qu’on est dans un cas simple où un élève appartient à une et une seule classe) aux classes. On peut

mettre comme attributs à l’entité Cours l’horaire du cours, auquel on ajoute tout simplement les trois

clés des entités Professeur, Classe et Salle, ce triplet constituant la clé primaire de l’entité Cours. On

a déjà un schéma assez satisfaisant, qu’on peut représenter de la façon suivante :

1 / 14 100%

Documents connexes

fiche_BDD1

Consultez l`offre

Passage MCD modèle relationnel

ÉCONOMIE D`ENTREPRISE ET MANAGEMENT DES

Bases de données et systèmes de gestion de bases de données

Le reel et ses dimensions

Les questions posées à l`épreuve pratique

Notion de SIEG

Synthèse - Lycée Alexis Monteil

la présence de caractères communs et l`évolution

Communication et Marketing : gestion de la vente

Les adjectifs épithètes et attributs

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Bases de données

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Bases de données

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib