OpenEdge Points sur les solutions PCA – PRA pour minimiser les risques en production Ateliers Progress Octobre 2015 Une Véritable Stratégie Je pense que nous devrions mettre à jour notre plan de reprise sur incident. L’actuel suggère, dans un cas de sinistre, de courir en cercle en criant « Que devons nous faire?!!! Que devons nous faire?!!! » 3 © 2014 Progress Software Corporation. All rights reserved. Plan de Continuité d’Activité (PCA) & Plan de Reprise d’Activité(PRA) Quelle est la Différence? La Continuite d'Activité a plusieurs aspects Personnel D’un point de vue IT , le PRA est une part plus importante de la pyramide Analyse Impact Métier Evaluation des risques Haute Disponibilité Réponse d’Urgence Relations Publiques Continuité Reprise d’Activité d’Activité Reprise d’Activité 4 © 2014 Progress Software Corporation. All rights reserved. Formation/ Prise de Conscience Continuité des Opérations Les exigences en matière de fiabilité Besoin d'identifier, résoudre et prévenir les problèmes avant qu'ils ne surviennent Besoin d'analyses les causes profondes des problèmes de l'application ou processus métier sans se rejeter la responsabilité Haute disponibilité signifie vraiment aucune interruption de service 5 © 2014 Progress Software Corporation. All rights reserved. Pourquoi la fiabilité est elle si importante? Visibilité sur l'expérience utilisateur Assurer qu’aucune étape d’un processus étapes ne manque Détection précoce de problèmes de performance et de disponibilité Guarantie des SLAs Réduction du temps et des ressources pour résoudre les problèmes 6 © 2014 Progress Software Corporation. All rights reserved. Quelles sont les causes les plus fréquentes de "temps d'arrêt non planifiés»? *Adapted from Blueprints for High Availability by Evan Marcus and Hal Stern (ISBN: 0-471-43026-9) 7 © 2014 Progress Software Corporation. All rights reserved. Les Métriques de l’Industrie pour un PRA RTO = la durée maximale d'interruption admissible Jours Secondes Temps de Reprise (RTO) RPO = la durée maximum d'enregistrement des données qu'il est acceptable de perdre Recovery Time Objective (RTO) – la durée maximale d'interruption admissible Recovery Point Objective (RPO) – la durée maximum d'enregistrement des données qu'il est acceptable de perdre ou le volume maximum de données qu’il est acceptable de perdre 0 K0’s 8 Volume de Perte de Données(RPO) © 2014 Progress Software Corporation. All rights reserved. Plusieurs MO’s Jours Où êtes vous aujourd’hui? Où devriez vous être? Secondes Temps de Reprise (RTO) Pourquoi est-ce important pour vous? 0 K0’s 9 Volume de Perte de Données(RPO)Plusieurs MO’s © 2014 Progress Software Corporation. All rights reserved. Clusters Uniquement Enterprise Database OE RDBMS n’est pas “Cluster Aware” • Peut être configurée pour s’exécuter sur une configuration de disques partagés • Pas d’intégration native entre Progress et les Cluster Manager • Le Cluster Manager est responsable des tâches d’administration pour garantir le failover Ensemble limité de Cluster Managers supportés (à vérifier dans le Product Availability Guide) • Microsoft Cluster Services V5.2 • IBM HA Clusters – 5.1, 5.3. 5.4.1, 6.1 • Sun Solaris Sun Cluster 2,2. 3.0, 3.1 and 3.2 • HP-UX Service Guard 11.0 and 11i 12 © 2014 Progress Software Corporation. All rights reserved. Concepts Cluster Concept Description Cluster Se compose de deux ou plusieurs machines, appelées nœuds, qui sont étroitement intégrés par matériel et logiciel pour travailler ensemble comme une seule machine virtuelle. Il gère le basculement en cas de panne d'un nœud. Failover Le basculement automatique d'une ressource de cluster d'un nœud à l'autre, offrant ainsi un accès permanent à ces ressources en cas de panne planifiée ou non. Un arrêt planifié est une mise à niveau de matériel ou de logiciel; une interruption non planifiée est un incident de base de données ou du système. Shared Devices Un disque qui est disponible à partir de n'importe quel nœud du cluster. Si un nœud du cluster subit une panne, le périphérique partagé est toujours reconnu et disponible pour les autres nœuds du cluster, offrant ainsi un accès ininterrompu à la base de données. Cluster Resources 13 Une base de données en cluster et toutes ses dépendances telles que les fichiers physiques, les disques physiques, et le réseau. © 2014 Progress Software Corporation. All rights reserved. Architecture Globale MYCLUST Heartbeat Node A Cluster Manager Local Disk 14 © 2014 Progress Software Corporation. All rights reserved. Shared Storage Node B Cluster Manager Local Disk Failover Clusters Gérer les Clusters Activer une base de données pour l'environnement en cluster Démarrer une base de données en cluster Arrêter une base de données en cluster Désactiver une base de données en cluster 15 © 2014 Progress Software Corporation. All rights reserved. Activer une base de données pour l'environnement en cluster procluster db-name enable [-pf parameter-file] [AI][BI][APW=n][WDOG] Shared Storage Failover Clusters Cluster-enabled database 16 © 2014 Progress Software Corporation. All rights reserved. Démarrer une base de données en cluster procluster db-name start Shared Storage Failover Clusters Cluster-enabled database procluster db-name isalive 17 © 2014 Progress Software Corporation. All rights reserved. Arrêter une base de données en cluster procluster db-name stop Shared Storage Failover Clusters Cluster-enabled database procluster db-name isalive 18 © 2014 Progress Software Corporation. All rights reserved. Désactiver une base de données en cluster procluster db-name disable Shared Storage Failover Clusters Database 19 © 2014 Progress Software Corporation. All rights reserved. Solutions OpenEdge pour PCA et PRA 20 © 2014 Progress Software Corporation. All rights reserved. PCA et PRA avec OpenEdge Replication / PLUS OE Replication Plus 21 © 2014 Progress Software Corporation. All rights reserved. Reprise OpenEdge – Database (DB) Notions de base Process Application Database Backup DB régulièrement Stockage “off-site” Reprise sur incident InstallationSoftware Restauration DB vers la cible Reconnexion des clients Backup Files Restored Database Risques 22 Temps de récupération = ELEVE (sur la base de la dernière sauvegarde « réussie", taille de la DB, etc.) Perte de données = ELEVE © 2014 Progress Software Corporation. All rights reserved. Backup Secondes Temps de Reprise (RTO) Jours Backup Database 0 K0’s Plusieurs MO’s Volume de Perte de Données(RPO) 23 © 2014 Progress Software Corporation. All rights reserved. Reprise OpenEdge – DB Notion de bases + After Imaging (AI) Process Backup DB régulièrement Backup fichiers AI régulièrement Stockage “off-site” Reprise sur incident Application Database After-Image Installation software Restauration fichiers DB & AI vers la cible Application (roll forward) fichiers AI Reconnexion clients AI 12:30 AI 1:00 AI 1:30 AI 2:00 Backup Files Target Database After-Image AI 12:30 AI 1:00 AI 1:30 AI 2:00 Risques 24 Temps de récupération = Plus Rapide (sur la base de la dernière sauvegarde « réussie", taille de la DB, et nombre de fichiers AI à appliquer, etc.) Perte de Données= MOYEN (basé sur le dernier fichier AI correct) © 2014 Progress Software Corporation. All rights reserved. After Imaging Manuel 0 K0’s Volume de Perte de Données(RPO) 25 Backup Secondes Temps de Reprise (RTO) Jours Backup Database versus After Imaging © 2014 Progress Software Corporation. All rights reserved. Plusieurs MO’s Reprise OpenEdge – OpenEdge Replication / Plus Process Installation / Configuration replication Maintien des backups DB & AI Read Only Reprise sur incident Application Database Fail over (manuel ou automatique) Reconnexion clients Replication Server Target Database Automated and Near Real Time 26 Risques Replication Temps de récupération = LE PLUS FAIBLE (Meilleur!) Agent Pertes de Données= LE PLUS FAIBLE (Meilleur!) © 2014 Progress Software Corporation. All rights reserved. Jours After Imaging Manuel Secondes Time to Recover (RTO) Backup Database versus AI versus OE Replication OE Replication 0 K0’s Volume de Perte de Données(RPO) 27 Backup © 2014 Progress Software Corporation. All rights reserved. Plusieurs MO’s OpenEdge Replication –Configuration Complète AI Mgmt Utility Source DB Primaire Secondaire AI Extents Database Broker Processes Replication Replication Target DB Server Agent Database Broker Processes Repl Queue 28 © 2014 Progress Software Corporation. All rights reserved. OpenEdge Replication Fonctionnalités AI Mgmt Utility Primary Source DB Primaire AI Extents Pas de changement dans les applications Database Broker Processes Repl Queue 29 Réplication de données Automatique AI Management Utility gère les backup AI. Replication Server © 2014 Progress Software Corporation. All rights reserved. OpenEdge Replication Fonctionnalités Supports de 2 serveurs Secondaires Secondaire Database Broker Processes Types de Failover • Manuel • Automatique Accès Read-only avec Replication Plus Replication Agent 30 © 2014 Progress Software Corporation. All rights reserved. Target DB Target Database OpenEdge Replication contraintes Produits OpenEdge 10 Enterprise & Workgroup RDBMS OpenEdge 11 Enterprise & Workgroup RDBMS Plateformes supportées, OS + Hardware Même OS sur serveur Primaire et Secondaire 31 © 2014 Progress Software Corporation. All rights reserved. Demo – 2. OpenEdge Replication Setup Source Database Setup Target Database Enable Replication Replicate entre Source et Target Mises à jour d’enregistrements dans la Database Source Les mises à jour sont appliquées automatiquement dans la Database Target Accès pour rapports ou autres (Read Only) à partir de la Database Target 32 © 2014 Progress Software Corporation. All rights reserved. Operation Normal User met à jours source database Source DB Replication Replication Server Agent AI BLOCK 33 © 2014 Progress Software Corporation. All rights reserved. “Roll Forward” permanent Target DB Demo – 3. Transition vers la Database Target Transition Database Target pour devenir Database Source Recovery Failover Reconnexion utilisateurs 34 © 2014 Progress Software Corporation. All rights reserved. Demo – 4. Transition de Target vers Source Backup de Database Source en cours Restauration de la Source courante vers la Source initiale Redémarrage du serveur Source Failback Transition Reconnexion utilisateurs 35 © 2014 Progress Software Corporation. All rights reserved. Demo – 5. Crash du serveur de Production Crash de la Database Source Transition la Target en tant que Source Shutdown de la Database Target Déconnexion des utilisateurs Démarrage de la database Target en mode transaction Reconnexion utilisateurs 36 © 2014 Progress Software Corporation. All rights reserved. Operation Normal User met à jours source database Source DB Replication Replication Server Agent AI BLOCK 37 © 2014 Progress Software Corporation. All rights reserved. “Roll Forward” permanent Target DB Crash Production User met à jours source database X Source DB Replication Replication Server Agent AI BLOCK 39 © 2014 Progress Software Corporation. All rights reserved. “Roll Forward” permanent Target DB Scenario de Reprise Target devient une database “Normal” X Source DB Replication Server 40 User met à jours la nouvelle “source” database X © 2014 Progress Software Corporation. All rights reserved. Replication X Agent “New” Source DB Demo – 6. Alerting from OpenEdge Management All the activity for Replication was recorded Emails to indicate Backup Restore Crash Transition 41 © 2014 Progress Software Corporation. All rights reserved. OpenEdge Replication – Points à Retenir 42 1 Disponibilité Continue 2 Protection Complète des Données Critiques 3 Intégrité Garantie des Données 4 Performance optimisée avec Replication Plus 5 Facile à implémenter pour ROI rapide © 2014 Progress Software Corporation. All rights reserved.