ALSI S26
STS2 IG
Répartition des données
Le 16/04/17
page 1/8
D:\769788450.doc
SOMMAIRE
1. Introduction ........................................................................................................................ 2
2. Définition ........................................................................................................................... 2
3. Règles de fonctionnement a respecter pour une base de données réparties ....................... 3
4. Placement des données ....................................................................................................... 4
5. Répartition des données ..................................................................................................... 4
6. Accès aux données ............................................................................................................. 5
6.1. Données distantes ........................................................................................................... 5
6.2. Données réparties ........................................................................................................... 5
7. La réplication des données ................................................................................................. 5
7.1. Quelles données répliquer ? ........................................................................................... 5
7.2. Propagation cohérente des modifications ....................................................................... 6
8. Répartition des données et intégrité ................................................................................... 6
9. Mise en œuvre de la réplication sur SQLServer 7 ............................................................. 7
9.1. 3 Types de réplication .................................................................................................... 7
9.2. Exemple de mise en œuvre de la réplication transactionnelle........................................ 7
ALSI S26
STS2 IG
Répartition des données
Le 16/04/17
page 2/8
D:\769788450.doc
1. INTRODUCTION
Dans un contexte multi-utilisateurs, plusieurs personnes peuvent utiliser simultanément un
même fichier. Le fichier se trouve sur un disque partagé d'un serveur et il est accessible par
différents postes de travail simultanément.
Ceci pose un certain nombre de problèmes quand le nombre d’utilisateurs devient trop
important :
- le nombre d’accès disque sur le serveur augmente
- le réseau est fortement sollicité
- le nombre d’accès concurrents augmente.
Ces problèmes entraînent une chute des performances de notre solution informatique si on
dépasse plus de 30 utilisateurs.
Le besoin de rapprocher les données de l'utilisateur afin d'éviter la saturation du réseau et le
nombre très important de requêtes à traiter par une seule machine a fait émerger le besoin de
répartir les données sur plusieurs machines
Les nouveaux SGBD (SGBD capables de gérer des données réparties) et le fait que le poste
de travail soit aujourd'hui un micro-ordinateur doté d'une puissance de stockage et de
traitement ont permis la mise en place d'architectures de type client-serveur de type 5 dans
lesquelles les données sont réparties sur le serveur et les postes de travail. On parle alors de
base de données réparties.
Dans quel cas mettre en place une base de données réparties?
. quand la quantité de données à traiter est importante ce qui nuit aux performances du SGBD
et sature le réseau,
ou / et
. quand le nombre d'utilisateurs est important ce qui rend le partage de la base centrale
inefficace.
2. DEFINITION
Un système d’informations répartie est un système dont les données et les applications sont
distribuées sur plusieurs systèmes connectés entre eux par réseau.
Une base de données réparties est un ensemble de bases de données situées sur différents
postes et apparaissant aux applications comme une seule et même base de données. Le fait
que les bases soient implantées sur des machines différentes est transparent pour l'utilisateur.
ALSI S26
STS2 IG
Répartition des données
Le 16/04/17
page 3/8
D:\769788450.doc
Dans une base de données partie, on distingue, d'une part, la base de données logique et,
d'autre part, les bases de données physiques.
La base de données vue de l'utilisateur comme une seule et même base de données est
appelée base logique.
Chaque base de données regroupée au sein d'une base logique est appelée base physique.
Un modèle logique des données réparti précise l'implantation des données permanentes sur
chacun des postes de travail d'un système. Le MLD réparti est composé de 2 à n MLD locaux.
Chaque MLD local est propre à un type de poste de travail.
3. REGLES DE FONCTIONNEMENT A RESPECTER POUR UNE BASE DE DONNEES REPARTIES
Chris Date a énoncé 12 règles pour un système réparti :
1 - Autonomie locale : chaque base physique appartenant à une base logique est
administrée localement.
2 - Indépendance vis-à-vis d'un site central : dans une base de données réparties, il n'y a pas
de site central. Chaque site possède son propre schéma relationnel, ses propres requêtes…
3 - Fonctionnement en continu : enlever ou ajouter des sites dans la base logique ou
modifier le schéma relationnel ou le SGBD sur un site ne doivent pas avoir d'impact sur
le fonctionnement de la base de données réparties.
4 - Indépendance de la localisation : la localisation physique des données doit être
transparente pour les utilisateurs. L'utilisateur peut travailler dans une même requête
sur des tables appartenant à des bases physiques différentes .
5 - Indépendance du partitionnement : les données d'une table doivent pouvoir être réparties
sur plusieurs sites pour favoriser la localité de référence (stocker les données sur le site
elles sont le plus utilisées). Ce partitionnement doit être transparent pour les utilisateurs.
6 - Indépendance de la duplication : les données d'une table doivent pouvoir être dupliquées
pour favoriser l'accessibilité et la fiabilité du système en cas de panne. Cette duplication doit
être transparente pour les utilisateurs.
BASE LOGIQUE
Base
physique A
Base
physique C
Base
physique B
ALSI S26
STS2 IG
Répartition des données
Le 16/04/17
page 4/8
D:\769788450.doc
7 -Traitement réparti des requêtes : les utilisateurs peuvent accéder à des données qui résident
sur différents postes. Les requêtes sont exécutées sur le poste résident les données. Le
poste maître de la requête est celui à partir duquel la requête est émise.
8 - Gestion des transactions réparties : un mécanisme automatique doit assurer l'intégrité des
données (Mécanisme de "Terminaison à deux phases" aussi appelé" Commit à deux phases").
Les accès concurrents aux données sont garantis par les mécanismes de verrouillage.
9 - Indépendance matérielle : les logiciels de la base de données réparties doivent pouvoir
s'exécuter sur plusieurs plates-formes matérielles.
10 - Indépendance du système d'exploitation : les logiciels de la base de données réparties
doivent pouvoir s'exécuter sur plusieurs systèmes d'exploitation. Les bases physiques peuvent
être implantées sur des systèmes d'exploitation différents.
11 - Indépendance du réseau : les sites de la base de données réparties doivent pouvoir être
reliées par différents types de réseaux. Les différentes bases physiques peuvent fonctionner
sur des machines reliées par des protocoles de réseaux différents.
12 - Indépendance du SGBD : les SGBD relationnels ou non doivent pouvoir participer à la
gestion de la base de données réparties.
4. PLACEMENT DES DONNEES
Les données peuvent être implantées sur les différents sites selon plusieurs critères tels que:
Le volume des données
- les données volumineuses seront stockées sur le serveur.
- les données peu volumineuses peuvent être stockées sur le serveur ou sur un poste de
travail.
Le type des données:
- données privées.
- données partagées.
Le mode et la fréquence d'utilisation des données:
- données sont en consultation fréquente ou peu fréquente.
- données ont une mise à jour fréquente ou peu fréquente.
- données en création, en consultation ou en suppression.
Le niveau de confidentialité
La durée de vie.
5. REPARTITION DES DONNEES
Pour répartir les données entre différents sites, on peut:
répartir les tables entre les sites en fonction des besoins.
dupliquer les tables sur différents sites : c'est la réplication des données.
ALSI S26
STS2 IG
Répartition des données
Le 16/04/17
page 5/8
D:\769788450.doc
6. ACCES AUX DONNEES
6.1. Données distantes
SELECT *
FROM siege.dbo.region
6.2. Données réparties
SELECT *
FROM siege.dbo.region R, marseille.dbo.client CM
WHERE R.NoRegion = CM.NoRegion
Chaque requête est effectuée localement.
Le serveur local décompose en sous-requêtes envoyées aux serveurs distants
Il récupère les données des serveurs distants et les traite avant de fournir le résultat
7. LA REPLICATION DES DONNEES
La réplication consiste à dupliquer les données à partir d'un site d'origine par envoi de
copies vers des sites de réplication (destinataires).
On fabrique des clônes de la base sur des serveurs distincts.
Les bases « clônes » peuvent être modifiées. L’opération qui consiste à regrouper toutes les
modifications effectuées sur les clônes et à les réintégrer dans la base de rérence s’appelle la
CONSOLIDATION.
7.1. Quelles données répliquer ?
On peut répliquer
une table entière
seulement certaines colonnes : partitionnement vertical
seulement certaines lignes : partitionnement horizontal (plus utilisé)
L'intérêt de partitionner une table sur différents sites est de rapprocher les données de
l'utilisateur et donc de diminuer les coûts de communication. En effet, les données d'une
même table peut-être consultée par différents utilisateurs mais pour un usage différent.
Prenons l'exemple d'une société dotée d'un siège social situé à Paris et de succursales réparties
dans les grandes villes de France:
Les comptables comme les commerciaux peuvent avoir besoin d'accéder à la table des
clients. Seulement les traitements qu'ils ont à effectuer sur cette table ne sont pas les
mêmes: le comptable doit mettre à jour certains fichiers clients (paiement de cotisation…)
alors les commerciaux souhaitent uniquement consulter la table des clients.
Cette même table client peut être répartie en fonction des régions: les clients concernant la
région parisienne peuvent se situer sur le site de Paris alors que les clients du Sud-Ouest
peuvent se situer sur le site de Bordeaux.
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !