Leçon 1Interprétation des journaux pour applications web et services système : /var/log/syslog, /var/log/messages, journald (journalctl), journaux spécifiques aux applications et filtrageApprenez à lire et filtrer les journaux Linux et macOS pour applications web et services. Vous travaillerez avec syslog, journald et journaux d'applications, en utilisant journalctl, grep et autres outils pour isoler les problèmes, corréler les événements et créer des requêtes de journaux répétables.
Structure de Syslog et emplacements courants des journauxUtilisation des filtres journalctl et plages temporellesLecture des journaux d'accès et d'erreurs des serveurs webFiltrage des journaux avec grep, awk et sedCorrélation des événements multi-services par horodatageLeçon 2Identification et analyse des processus : ps aux, pstree, pmap, lsof, strace — trouver le processus fautif et inspecter son comportementDéveloppez des techniques pour trouver et inspecter les processus problématiques. En utilisant ps, pstree, pmap, lsof et strace, vous cartographierez les hiérarchies de processus, examinerez les fichiers et ports ouverts, tracerez les appels système et relierez les pics de ressources à des PIDs spécifiques.
Localisation des processus lourds avec ps et topVisualisation des parents et enfants avec pstreeInspection des cartes mémoire avec pmapRecherche de fichiers et ports ouverts avec lsofTraçage des appels système et blocages avec straceLeçon 3Diagnostic réseau sur Linux : ss, netstat, ip a, ip route, ethtool, ifconfig — lecture des informations d'interface et de routageAcquérez des compétences pour diagnostiquer les problèmes réseau Linux et macOS. Vous utiliserez ss, netstat, ip, ifconfig et ethtool pour inspecter les sockets, routes et interfaces, identifier les services en écoute et vérifier les problèmes de connectivité et de débit.
Liste des ports en écoute avec ss et netstatInspection des adresses IP et routes avec ipVérification de la vitesse et duplex avec ethtoolUtilisation d'ifconfig et ip pour l'état des interfacesDétection des problèmes courants de routage et DNSLeçon 4Enquête sur les E/S disque : iostat, iotop, blktrace, vérification des types de systèmes de fichiers et options de montageEnquêtez sur les goulots d'étranglement E/S disque et le comportement des systèmes de fichiers. Vous utiliserez iostat, iotop et blktrace, inspecterez les types de systèmes de fichiers et options de montage, et relierez les motifs E/S aux charges applicatives et symptômes de latence.
Détection de la saturation E/S avec iostatRecherche de processus E/S intensifs avec iotopTraçage de l'activité au niveau bloc avec blktraceComparaison des types de systèmes de fichiers et compromisExamen des options de montage pour les performancesLeçon 5Commandes pour surveillance en direct : top, htop, vmstat, iostat, sar, mpstat — exemples d'utilisation exacts et interprétationExplorez les outils de surveillance en direct pour comprendre le comportement système en temps réel. Vous utiliserez top, htop, vmstat, iostat, sar et mpstat pour repérer les goulots d'étranglement CPU, mémoire et E/S, interpréter les champs clés et capturer des instantanés de performance courts.
Lecture CPU et charge dans top et htopUtilisation de vmstat pour les insights mémoire et swapSurveillance E/S disque avec iostat et iotopInstantanés historiques avec sar et mpstatExportation des sorties de commandes pour examen ultérieurLeçon 6Analyse des performances des serveurs web : modules de statut nginx/apache, journaux d'accès/erreurs, analyse des requêtes lentes, motifs de statuts HTTPApprenez à évaluer les performances des serveurs web nginx et Apache. Vous lirez les modules de statut, analyserez les journaux d'accès et d'erreurs, détecterez les requêtes lentes et interpréterez les motifs de statuts HTTP pour distinguer les problèmes clients des goulots d'étranglement serveur.
Activation et lecture des endpoints de statut nginxUtilisation de mod_status Apache et server-statusIdentification des requêtes lentes et timeoutsAnalyse des distributions de codes de statut HTTPDétection des bots, scans et trafic abusifLeçon 7Remédiation à long terme : planification de capacité, limites de ressources (systemd, cgroups), réglage des configs noyau et serveur web, outils de profilage applicatif et quand les utiliserPlanifiez des correctifs à long terme au lieu de pompiers répétés. Vous pratiquerez la planification de capacité, définirez des limites de ressources avec systemd et cgroups, réglerez les paramètres noyau et serveur web, et choisirez des outils de profilage pour guider les changements de code et config.
Collecte de données pour la planification de capacitéConfiguration des limites de ressources des unités systemdApplication de contraintes cgroup de base en sécuritéRéglage des paramètres noyau et serveur webSélection et utilisation des outils de profilage applicatifLeçon 8Compréhension des métriques de ressources système : CPU, mémoire, E/S, réseau — que surveiller et pourquoiComprenez les métriques système de base et ce qu'elles révèlent sur la santé. Vous interpréterez les indicateurs CPU, mémoire, disque et réseau, apprendrez les seuils sûrs et déciderez quelles métriques importent le plus pour les charges web et services en arrière-plan.
Utilisation CPU, moyenne de charge et files d'attenteUtilisation mémoire, cache et comportement swapDébit disque, latence et profondeur de fileBande passante réseau, erreurs et pertesChoix des seuils d'alerte pour les métriques clésLeçon 9Techniques de mitigation temporaires : redémarrage des services, ajustement de la priorité des processus, libération des caches, mise hors ligne gracieuse des services — commandes et résultats attendusAppliquez des mitigations temporaires sûres pendant les incidents. Vous redémarrerez des services, ajusterez la priorité, gérerez les caches et mettrez hors ligne gracieusement les services, en comprenant les commandes, risques et comment vérifier l'efficacité des mitigations.
Redémarrage sûr des services critiquesAjustement de la priorité des processus avec nice et reniceLibération prudente du cache de pages et dentriesMise des applications web en mode maintenanceVérification de l'impact des mitigations sur les métriques