Leçon 1Stratégies de sauvegarde : complète vs incrémentielle, sauvegardes logiques vs physiques de BD, sauvegardes système de fichiers vs application, politiques de rétentionConcevez des stratégies de sauvegarde pour les serveurs et les bases de données, en comparant les sauvegardes complètes et incrémentielles, les méthodes logiques et physiques, et les approches au niveau système de fichiers versus application. Définissez la rétention, le chiffrement et les pratiques de vérification.
Plans de sauvegarde complète vs incrémentielleSauvegardes logiques vs physiques de BDSauvegardes système de fichiers et applicationChiffrement des sauvegardes et contrôle d'accèsCalendriers de rétention et besoins légauxLeçon 2Journalisation centralisée : syslog vs logstash vs fluentd, rotation des logs, rétention, stratégies d'indexation et dimensionnement pour une app interneApprenez à centraliser les logs pour une application interne en utilisant syslog, Logstash ou Fluentd. Nous couvrons la collecte des logs, la rotation, la rétention, les stratégies d'indexation et le dimensionnement de capacité pour supporter le dépannage et les besoins de conformité.
Choix des expéditeurs et collecteurs de logsConception des formats de logs et métadonnéesPolitiques de rotation et rétention des logsStratégies d'indexation pour recherche rapideDimensionnement stockage et taux d'ingestionLeçon 3Conception d'une architecture 4 nœuds : rôles et séparation (2 serveurs web, 1 travailleur app, 1 BD, log/monitor central optionnel)Concevez une architecture pratique à quatre nœuds avec une séparation claire des rôles. Vous placerez deux serveurs web, un travailleur d'application et un nœud de base de données, et envisagerez d'ajouter une journalisation et surveillance centralisées pour l'observabilité et la résilience.
Définition des rôles pour chaque nœud serveurConception du niveau web et proxys inversesModèles de travailleur d'application et files d'attentePlacement de la base de données et connectivitéAjout de journalisation et surveillance partagéesLeçon 4Conception réseau : réseaux privés, groupes de sécurité, règles pare-feu, NAT et routage entre on-prem et cloudApprenez à concevoir des réseaux sécurisés et résilients pour des environnements hybrides. Nous couvrons les sous-réseaux privés, les groupes de sécurité, les politiques de pare-feu, les modèles NAT et le routage entre locaux et cloud pour supporter des déploiements de serveurs évolutifs.
Conception de sous-réseaux privés et publicsGroupes de sécurité et conception de règles pare-feuPasserelles NAT et accès internet sortantRoutage entre VPC on-prem et cloudSegmentation réseau pour niveaux d'applicationLeçon 5Gestion des correctifs : cycle de vie des paquets OS, outils de gestion de configuration (Ansible, Puppet, Salt), fenêtres programmées et plans de rollbackPlanifiez et exploitez la gestion des correctifs pour les systèmes d'exploitation et applications. Apprenez les cycles de vie des paquets, l'utilisation d'Ansible, Puppet ou Salt, la planification des fenêtres de maintenance, les tests de mises à jour et la préparation des plans de rollback et de communication.
Concepts de cycle de vie OS et paquetsUtilisation d'Ansible, Puppet ou SaltTests de correctifs et environnements de stagingPlanification des fenêtres de maintenanceStratégies de rollback et communicationLeçon 6Contrôle d'accès et authentification : gestion des clés SSH, modèles bastion host, jumpboxes, placement VPN, considérations MFAConcevez un contrôle d'accès sécurisé pour les serveurs en utilisant les clés SSH, bastions et VPN. Apprenez la gestion du cycle de vie des clés, les modèles jumpbox, l'intégration MFA et la journalisation des accès administratifs pour la conformité et la réponse aux incidents.
Génération et rotation des clés SSHBastions et modèles jumpboxPlacement VPN et flux de traficIntégration MFA pour accès adminAudit et journalisation des sessions distantesLeçon 7Tests de restauration : exercices de récupération, restauration point dans le temps pour bases de données, concepts RTO/RPO et validation des restaurationsComprenez comment prouver que les sauvegardes sont utilisables via des tests de restauration structurés. Vous pratiquerez des exercices de récupération, des restaurations point dans le temps de bases de données et des étapes de validation alignées sur les objectifs RTO et RPO pour les services internes critiques.
Définition des objectifs RTO et RPOPlanification et exécution d'exercices de récupérationTests de restauration point dans le temps BDValidation des restaurations au niveau applicationDocumentation et revue des résultats de testsLeçon 8Runbooks et playbooks opérationnels : création et stockage des runbooks, gestion des changements, exemples de runbooks pour tâches courantesCréez des runbooks et playbooks opérationnels efficaces pour les tâches routinières et d'urgence. Apprenez la structure, le stockage et le contrôle des changements, et examinez des exemples concrets pour les déploiements, redémarrages, triage d'incidents et étapes de rollback.
Structure des runbooks et détails requisVersioning et stockage des runbooksGestion des changements et approbationsRunbooks pour tâches de maintenance courantesPlaybooks de réponse aux incidents et escaladeLeçon 9Architecture de base de surveillance et alerte : métriques, logs, traces ; choix d'une pile de surveillance (Prometheus, Grafana, Alertmanager, Nagios, Zabbix)Construisez une architecture de base de surveillance et d'alerte en utilisant métriques, logs et traces. Comparez Prometheus, Grafana, Alertmanager, Nagios et Zabbix, et concevez des règles d'alerte, tableaux de bord et chemins d'escalade pour les services internes.
Signaux clés métriques, logs et traçageSélection d'une pile d'outils de surveillanceConception de tableaux de bord pour opérateursRègles d'alerte, seuils et contrôle du bruitPolitiques d'escalade et flux on-callLeçon 10Compromis haute disponibilité et redondance pour une app interne de taille moyenne (équilibrage de charge, sessions persistantes, magasins de sessions)Explorez les modèles haute disponibilité et compromis de redondance pour une app interne de taille moyenne. Apprenez les options d'équilibrage de charge, la gestion des sessions persistantes, les magasins de sessions externes et les scénarios de panne pour équilibrer coût, complexité et disponibilité.
Identification des exigences de disponibilitéTypes d'équilibreurs de charge et contrôles santéSessions persistantes vs conception sans étatMagasins de sessions externes et cacheModes de panne et dégradation gracieuse