MaintenirunmodèleACIDaunimpacténormesurlesperformances(créationde
snapshots
, mise en place de verrous coûteux, attente de confirmation par le
disquequelesdonnéessontsauvées,…).
Commentaugmenterlesperformancesetlevolumedesdonnées?
Prendreun serveurplus puissant(ex. OracleExadata de40000à1 300000
USD+souscriptionmensuelle,entretien,…)
Mettreplusieursserveurs?Trèsdifficile,pourquoi?
DistributionetmodèleACID
Ilexistedeuxmodèlesdedistributionpossible:
Plusieursserveurscontenantchacununecopiecomplètedelabase:
Performancesaccruespourlesrequêtes
Diversitégéographiquepossible(plusgranderésistanceauxévènement
extérieurs)
Baissedesperformancespourlesmisesàjour
Nepermetpasdestockerplusdedonnéesquesurunseulserveur
Partitionnementdesdonnées.UnerelationRpeutêtredécoupésenmorceaux
R1,…,R1,disposéssurdes machines différentes. Ledécoupagepeut se faire
parcolonnesouparlignes.
Augmentationdelacapacitédestockageglobale
Jointures très coûteuses si deux colonnes sont sur deux machines
différentes
Agrégatscoûteuxsileslignessontsurdeuxmachinesdifférentes
Unemachineenpanneouinaccessiblecompromettoutlesystème
LemodèleACIDest-iltoujoursadapté?
LemodèleACIDestparfoistropcontraignant:
Systèmederéservationdebilletsd'avion?ModèleACIDnécessaire
Calcul du nombre de messages envoyé par utilisateurs de chaque tranche
d'âge,surFacebook?ModèleACIDinutile
Yat-ilunmodèlealternatif?
Lethéorème(énoncécommeuneconjectureen1999parE.Breweretprouvéen
2004)ditquedansunsystèmedistribuépartageantdesdonnées,auplus2des3
propriétéssuivantespeuventêtreoptimale:
Consistency(cohérence):touslesnœudsdecalculvoientlesmêmedonnées
aumêmemoment
Availability (disponibilité) : chaque requête reçoit une réponse de succès ou
d'échec
Partition tolerence (tolérance aux pannes) : le système continue de
fonctionner correctement malgré un découpage arbitraire lié à des pannes
réseau
Le théorème en lui-même est souvent mal interprété. Il a surtout été énoncé
(d'aprèsBrewer)pourinciterlesgensàexplorerd'autresmodèles/compromis.