TP 12 – Bases de données (2 ème partie)

Téléchargement

Math Sup PCSI Mercredi 28 mai

Page 1/3

TP 12 – Bases de données (2ème partie)

Buts du TP

– Vérifier que tout le monde sait maintenant créer/alimenter une base « à l’aide d’un outil interactif ».

– Pratiquer des requêtes avec fonctions d’agrégation.

– Faire des requêtes mixant agrégations et jointures plus ou moins élaborées.

Avant toute chose :

Créer dans votre dossier personnel un dossier associé à ce TP et copier dans ce dossier les fichiers :

titres_reserves.csv prenoms_paris.db notes_colle.db clubs.csv foot0.db

Exercice 1 : Création et alimentation d’une base de données

Partie I : Créons une base à la souris.

1) Créer (depuis Sqliteman) une base de données contenant deux tables aux schémas relationnels

suivants :

classes (idc:entier; type:texte; prof_maths:entier; prof_info:entier)

profs (idp:entier; nom:texte; prenom:texte)

2) Entrer quelques lignes dans chacune de ces bases. Il y aura par exemple les n-uplets :

(602, ’MPSI’, 17, 42)

(612, ’PCSI’, 15, 15)

(804, ’TSI-1’, 23, 23)

(42, ’Fèvre’, ’Matthieu’)

(23, ’Bono’, ’Laurence’)

3) Enregistrer les modifications effectuées puis quitter Sqliteman et le relancer pour rouvrir la base

précédemment créée ; vérifier que tout le monde est où il faut !

Partie II : Importons une table

4) Ouvrir le fichier titres_reserves.csv, qui contient les 1000 titres les plus réservés dans les

bibliothèques municipales à Paris en 2013. Observer la nature des informations, et en déduire un

schéma relationnel pour inclure ces données dans une table.

5) Créer une base de données constituée d’une table répondant à ce schéma.

6) Importer les données du fichier csv dans cette table. Il y aura des erreurs à la création, mais on les

ignorera. Fermer Sqliteman puis l’ouvrir, et charger la base de données préalablement créée.

7) Exécuter la requête :

SELECT auteurs, SUM(nombre) AS s FROM prets GROUP BY auteurs ORDER BY s DESC

Observer le résultat (dans les 20 premiers titres), et pointer le problème : c’est typique d’une base de

données mal conçue/pensée au départ.

8) Expliquer comment il aurait fallu concevoir la base de données pour éviter ce problème.

Exercice 2 : Prénoms parisiens

La base prenoms_paris.db contient les prénoms enregistrés à l’état civil de Paris entre 2004 et 2013.

1) Donner le schéma relationnel (différents attributs) des différentes tables de cette base.

2) Pour chacune de requêtes SQL suivantes, donner la traduction « en français », et vérifier la

vraisemblance du résultat depuis Sqliteman.

SELECT DISTINCT prenom FROM prenoms

SELECT SUM(nombre) FROM prenoms

SELECT COUNT(DISTINCT prenom) FROM prenoms

SELECT annee, SUM(nombre) FROM prenoms GROUP BY annee

3) Combien de fois votre prénom a-t-il été donné à Paris pendant les années concernées ? On donnera le

résultat trié par années croissantes. Attention aux accents, pas toujours bien mis dans la base.

4) Même question avec le prénom de votre prof de chimie ou de SI. Et on ne rigole pas !

5) Donner, pour chaque année, le nombre de prénoms différents qui ont été enregistrés.

6) Quels prénoms ont été donnés exactement 100 fois ? J’en trouve 7.

Math Sup PCSI Mercredi 28 mai

Page 2/3

7) Quels sont les prénoms masculin et féminin les plus donnés sur l’ensemble de la période ?

Exercice 3 : Notes de colles

La base de données notes_colles.db contient trois tables, décrivant des colles virtuelles, données par

des agrégés de la promotion 1930 à des agrégés de la promotion 1950.

1) Ouvrir cette base. Écrire le schéma relationnel des différentes tables. Comprendre le lien entre ces

tables.

2) Déterminer la liste des professeurs... et celle des élèves.

3) Déterminer le nombre de « 20 » qui ont été attribués, ainsi que les notes majorées par 6.

4) Déterminer les notes de Jacques-Louis Lions (triées selon les semaines croissantes).

5) Refaire la même chose, en ajoutant cette fois le nom des colleurs.

6) Déterminer les quadruplets (élève, professeur, note, semaine) pour toutes les colles où la note était

supérieure ou égale à 19.

7) Déterminer la moyenne des notes de colle de Jacques-Louis Lions.

8) Parmi tous les élèves, déterminer le nom de ceux ayant eu au moins 10 notes strictement sous la

moyenne.

9) Parmi tous les élèves, afficher ceux ayant eu au moins 6 notes strictement supérieures à 18.

10) Déterminer la liste des couples (élève, moyenne).

11) Classer les colleurs par ordre décroissant des moyennes des notes qu'ils ont attribué.

12) Respirer lentement, puis écrire une requête permettant de calculer la moyenne des moyennes de tous

les élèves. Merci de ne pas tricher, et bien calculer une moyenne de moyennes, et non pas la moyenne

globale des notes (qui est la même ici, tout le monde ayant eu 25 colles !)

Exercice 4 : Des matchs de foot

On veut créer une base de matchs de foot entre clubs européens prestigieux (le Réal, la Juve, Guingamp,

etc.) sur quelques dizaines d’années, disons de 1971 à 2014.

Les impatients peuvent passer directement à la dernière partie…

Partie I : Les clubs

1) Ouvrir le fichier clubs.csv et en observer le contenu. Définir sur papier un schéma relationnel

permettant de représenter les différents clubs. On impose un identifiant entier qui sera une clé

primaire. Pour jeter à la poubelle une éventuelle table, puis en créer une, les commandes SQL sont

typiquement :

DROP TABLE IF EXISTS clubs

CREATE TABLE clubs

(idc integer not null primary key,

nom text,

...)

2) Dans un script Python, créer une base de données, constituée d’une table clubs, et l’alimenter à

l’aide du fichier clubs.csv. On s'aidera de la syntaxe utilisée dans le TP précédent.

Partie II : Et maintenant, les matchs

Un match est la donnée de deux clubs distincts, deux scores, une année, et un jour dans cette année.

3) Définir sur papier un schéma relationnel pour constituer une table de matchs. Ajouter cette table

(vierge, pour le moment) à la base de données en cours.

Pour établir le nombre  de buts marqués par une équipe lors d’un match (sans prendre en compte le fait

de jouer à domicile ou à l'extérieur), on tire au hasard un réel   . Ensuite :

- Si   

,  vaut 0

- Si 

 

,  vaut 1

- Si 

    

,  vaut 2

- Sinon, on détermine le plus petit    tel que   

   

 et  vaut alors .

Math Sup PCSI Mercredi 28 mai

Page 3/3

4) Écrire une fonction Python buts(), sans argument, et retournant un entier déterminé selon les règles

précédentes. Vérifier la vraisemblance en faisant  tirages et en observant les fréquences.

Les probabilités théoriques d’obtenir 0, 1, 2, ... buts sont respectivement 





 



5) Remplir la base en réalisant 100 matchs aléatoires pour chaque année entre 1971 et 2014.

La base foot0.db est un exemple de telle base générée aléatoirement.

Partie III : Et maintenant, jouons un peu !

6) Que signifie la requête suivante ?

SELECT c1.nom, sc1, c2.nom, sc2

FROM clubs c1 JOIN matchs JOIN clubs c2

ON c1.idc = eq1 AND c2.idc = eq2

WHERE c1.nom = "Real Madrid" OR c2.nom = "Real Madrid"

7) Déterminer les matchs où Guingamp a mis strictement plus de deux buts à l’extérieur sans gagner.

Tout le monde sait que l'on cite toujours en premier le club qui joue à domicile.

8) Combien de fois un club français a-t-il marqué au moins 4 buts contre un club italien ?

9) Quel est le club ayant marqué le plus de buts à l'extérieur ?

10) Quel est le club ayant encaissé le plus de buts ?

11) Quels sont les clubs ayant plus de réussite en mars qu'en mai (on ne tiendra pas compte des années

bissextiles) ?

12) Concevoir quelques requêtes absurdes… Ça y est, vous êtes prêts pour concevoir des feuilles de TP

vous-mêmes !

1 / 3 100%

Documents connexes

Bases de données (2/3) 1 Création et alimentation d`une base de

65 % 10 % 215 réalisations 7 missions économiques

DUT GEA – Semestre 3 (seconde année)

Les clubs de jeux mathématiques : quels objectifs, quelles activités

Charte sur la publicité

Référentiel d`indicateurs pour auto-évaluer l`éco

Merci encore, Ruth Cunningham, 514-696

Les clubs d`entreprises

Ministère de l’Environnement et du Développement Durable

Animations et Vulgarisation Scientifiques

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

TP 12 – Bases de données (2 ème partie)

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

TP 12 – Bases de données (2 ème partie)

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib