Machines Bases de Données
Patrick Valduriez
Bases de Données Parallèles
Polytech’IG4 Traitement de Données Distribuées
Esther Pacitti
2
1. Machine base de données
SGBD sur multiprocesseur ou cluster
On parle aussi de SGBD parallèes
Performances grâce au parallélisme
haut débit transactionnel (OLTP)
bon temps de réponse des requêtes décisionnelles
(OLAP)
Haute disponibilité et fiabilité grâce à la
réplication
Extensibilité avec idéalement
speed-up linéaire
scale-up linéaire
Machines Bases de Données
Patrick Valduriez
3
Speed-up linéaire
Augmentation linéaire des performances pour
une BD et charge constantes en augmentant la
configuration (processeurs, mémoire, disque)
par ex. en doublant la config.,
t(Q)
est divisé par 2
perf. obtenue
perf. initiale
idéal
configuration
4
Scale-up linéaire
Performance constante pour une augmentation
proportionnelle de la BD ou de la charge et de la
configuration
par ex. en doublant la BD et la config., même
t(Q)
idéal
Configuration et
(taille (bd) ou charge (bd))
perf. obtenue
perf. initiale
Machines Bases de Données
Patrick Valduriez
5
Architecture à disque partagé
Partage des disques (shared disk)
Network Attached Storage (NAS)
simple, niveau fichier (NFS), ok pour
qqs noeuds
Storage Area Network (SAN)
sophistiqué, niveau block, passe à
l’échelle
Critique
+ simplicité et extensibilité
- gestion de la cohérence des caches
(M) peut limiter les performances
M
P
P
M
P
P
6
Architecture à mémoire distribuée
Pas de partage de mémoire ou
disque (
shared-nothing
)
+ extensibilité et disponibilité
excellentes
-complexe: besoin de partitionner
statiquement les données sur
disque
Utilisée pour clusters de PC
Excellent rapport performance-
coût avec des nœuds standards
Avec ou sans partage de disque
M
P
P
M
P
P
Machines Bases de Données
Patrick Valduriez
7
Mem
Disk
CPU
Mem
Disk
CPU
Switch
Un rack = 16-64 noeuds
Mem
Disk
CPU
Mem
Disk
CPU
Switch
Switch
1 Gbps entre
noeuds d’un rack
Backbone de 2-10 Gbps entre racks
Architecture de cluster
8
2. Techniques
Partitionnement des données sur n nœuds
Round-robin, fonction de hachage, index, etc.
Réplication
Augmente les performances et la disponibilité
Traitement de requêtes parallèles
Décomposition des requêtes lourdes en sous requêtes en
fonction du partitionnement
Equilibrage de charge
Allocation des requêtes aux nœuds les moins chargés
Failover: basculement automatique des requêtes
Depuis un nœud primaire en panne vers un nœud secondaire
Transactions
2PC
Machines Bases de Données
Patrick Valduriez
9
Partitionnement des données
Round-Robin!
•••!
•••!•••!
Hachage!
•••!
Intervalle!
•••!
•••!
a-g!h-m!u-z!
Chaque relation est gérée comme
n
partitions
10
Réplication
Noeud 1 2 3 4
Table R1 R2 R3 R4
R1 r12 r13 r14
R2 r21 r23 r24
R3 r31 r32 r34
R4 r41 r42 r43
Améliore la haute
disponibilité
Disques miroirs
Heurte l’équilibrage
de charge lorsqu’un
nœud tombe en
panne
Solution élaborée, ex.
partitionnement chaîné
de Teradata
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !