Leson 1Analyse mémoire : free -m, /proc/meminfo, slabtop, smem—interprétation mémoire utilisée vs disponible et comportement swapIci vous analyserez le comportement mémoire avec free, /proc/meminfo, slabtop et smem. La section explique le cache Linux, les tampons et le reclaim, comment interpréter l'usage swap et détecter les fuites mémoire, fragmentation et limites mal configurées.
Lecture free -m et compréhension mémoire cachéeChamps clés /proc/meminfo pour diagnosticUtilisation slabtop pour inspecter usage slab kernelUtilisation smem pour attribuer mémoire par processusReconnaissance thrashing swap et risques OOMLeson 2Utilisation réseau et goulots d'étranglement : iftop, nload, ss, netstat, ip -s link, tc, tcpdump—identification saturation réseau et connexions problématiquesCette section couvre le diagnostic usage réseau et goulots avec iftop, nload, ss, ip, tc et tcpdump. Vous apprendrez à identifier saturation, voisins bruyants, états connexions et problèmes paquets contribuant à applications lentes.
Surveillance bande passante live avec iftop et nloadInspection sockets et états avec ssUtilisation ip -s link pour erreurs interfaceBases tc pour shaping et limitation débitCapture paquets ciblée avec tcpdumpLeson 3Latence stockage et E/S approfondie : blktrace, bpftrace (scripts basiques), fio tests—mesure et interprétation latence et débitCette section couvre latence stockage et analyse E/S approfondie avec blktrace, scripts bpftrace basiques et benchmarks fio. Vous apprendrez à mesurer latence et débit, interpréter profondeur file et distinguer limites dispositif de problèmes charge.
Compréhension latence, IOPS et débitUtilisation blktrace pour inspecter patterns E/S blocScripts bpftrace introductifs pour latence disqueConception charges fio mimant productionLecture rapports fio et détection goulotsLeson 4Investigation processus : ps, filtres top/htop, pgrep, pidstat, nice/renice—trouver processus CPU et mémoire intensifsVous apprendrez à investiguer processus avec ps, filtres top/htop, pgrep, pidstat et nice/renice. La section montre comment identifier tâches CPU/mémoire lourdes, tracer E/S par processus et ajuster priorités pour réduire contention.
Listage et filtrage processus avec psUtilisation pgrep et pkill sûre et préciseUtilisation pidstat pour CPU et E/S par processusFiltrage top/htop par utilisateur ou ressourceAjustement priorités avec nice et reniceLeson 5Vue d'ensemble ressources système : top, htop, vmstat, mpstat, dstat—ce que chacun montre et patterns sortie attendusIci vous apprendrez à lire instantanés ressources système avec top, htop, vmstat, mpstat et dstat. La section se concentre sur compréhension métriques CPU, mémoire et charge, reconnaissance patterns normaux vs pathologiques.
Champs clés CPU, charge, mémoire dans topUtilisation htop pour analyse processus interactivevmstat pour file d'exécution, swap, insight E/Smpstat pour utilisation par-CPU et steal timedstat pour timelines multi-ressources combinéesLeson 6E/S disque et vérifications système de fichiers : iostat, iotop, sar -d, lsblk, df -h, du -sh, tune2fs, xfs_info—détection goulots E/S et espace faibleCette section se concentre sur E/S disque et santé système de fichiers avec iostat, iotop, sar -d, lsblk, df, du, tune2fs et xfs_info. Vous apprendrez à détecter saturation, accumulation file, erreurs système fichiers et conditions espace faible dégradant performance.
Utilisation iostat pour repérer dispositifs occupés/lentsUtilisation iotop pour processus E/S lourdssar -d pour tendances utilisation disque historiquesVérification layout/types avec lsblk et dfTrouver gaspilleurs espace avec du et inodesLeson 7Journaux système et journaling : journalctl (systemd), /var/log/messages, /var/log/syslog, logs auth—quoi chercher et pourquoiCette section explique utilisation journalctl systemd et fichiers logs classiques /var/log/messages, /var/log/syslog, logs authentification. Vous apprendrez patterns à chercher, filtrer bruit et comment logs supportent analyse cause racine.
Bases journalctl et options filtrage utilesLecture /var/log/messages et /var/log/syslogTrouver erreurs, avertissements, événements limités tauxAnalyse logs authentification et sudoCorrélation timestamps logs avec incidentsLeson 8Surveillance temporelle et historique : sar, sysstat, collectl—collecte et lecture métriques historiques pour corréler événementsVous apprendrez à collecter et interpréter métriques historiques avec sar, sysstat et collectl. La section explique planification collecte données, lecture rapports séries temporelles et corrélation anomalies performance avec changements config ou déploiements.
Activation et configuration collecte sysstatUtilisation sar pour historique CPU, mémoire, E/SLecture tendances sar réseau et moyenne chargeUtilisation collectl pour timelines multi-ressourcesCorrélation métriques avec fenêtres changementsLeson 9Insights kernel et ordonnanceur : dmesg, sysctl -a, paramètres /proc/sys/vm—ce que messages kernel et tunables révèlentIci vous explorerez insights kernel et ordonnanceur avec dmesg, sysctl et paramètres /proc/sys/vm. La section explique comment messages kernel, tunables et comportement ordonnanceur révèlent problèmes hardware, mauvaises configs et options tuning.
Lecture dmesg pour problèmes hardware et driversListage et requête valeurs tunables sysctlParamètres clés /proc/sys/vm pour mémoireAperçu paramètres kernel ordonnanceurPersistance sûre changements tuning kernelLeson 10Approche détermination cause racine : arbre décision étape par étape pour classer problèmes CPU, RAM, E/S disque ou réseauCette section présente arbre décision pratique pour analyse cause racine. Vous apprendrez à classer incidents comme liés CPU, mémoire, E/S disque ou réseau, outils à lancer par branche et raffiner itérativement hypothèses avec preuves collectées.
Triage initial et énoncé problèmeClassification symptômes liés CPU vs E/SDistinction pression mémoire de fuitesIdentification goulots réseau vs locauxTest hypothèses itératif avec métriques