Lekce 1Analýza paměti: free -m, /proc/meminfo, slabtop, smem – interpretace použité vs dostupné paměti a chování swapuZde analyzujete chování paměti pomocí free, /proc/meminfo, slabtop a smem. Sekce vysvětluje Linux caching, buffery a reclaim, jak interpretovat využití swapu a jak detekovat úniky paměti, fragmentaci a špatně nastavené limity.
Reading free -m and understanding cached memoryKey fields in /proc/meminfo for diagnosisUsing slabtop to inspect kernel slab usageUsing smem to attribute memory per processRecognizing swap thrashing and OOM risksLekce 2Využití sítě a úzká místa: iftop, nload, ss, netstat, ip -s link, tc, tcpdump – identifikace saturace sítě a problematických připojeníTato sekce pokrývá diagnostiku využití sítě a úzkých míst pomocí iftop, nload, ss, ip, tc a tcpdump. Naučíte se identifikovat saturaci, hlučné sousedy, stavy připojení a problémy na úrovni paketů, které přispívají k pomalým aplikacím.
Monitoring live bandwidth with iftop and nloadInspecting sockets and states with ssUsing ip -s link to view interface errorsBasics of tc for shaping and rate limitingTargeted packet capture with tcpdumpLekce 3Latence úložiště a hlubší I/O: blktrace, bpftrace (základní skripty), fio pro testy – jak měřit a interpretovat latenci a propustnostTato sekce pokrývá latenci úložiště a hlubší analýzu I/O pomocí blktrace, základních skriptů bpftrace a benchmarků fio. Naučíte se měřit latenci a propustnost, interpretovat hloubku fronty a odlišit limity zařízení od problémů pracovní zátěže.
Understanding latency, IOPS, and throughputUsing blktrace to inspect block I/O patternsIntroductory bpftrace scripts for disk latencyDesigning fio workloads that mimic productionReading fio reports and spotting bottlenecksLekce 4Vyšetřování procesů: ps, filtry top/htop, pgrep, pidstat, nice/renice – jak najít CPU- a paměťově náročné procesyNaučíte se provádět vyšetřování procesů s ps, filtry top nebo htop, pgrep, pidstat a nice nebo renice. Sekce ukazuje, jak identifikovat CPU a paměťově náročné úlohy, sledovat I/O na proces a upravovat priority k snížení konfliktů.
Listing and filtering processes with psUsing pgrep and pkill safely and preciselyUsing pidstat for per process CPU and I/OFiltering top and htop by user or resourceAdjusting priorities with nice and reniceLekce 5Přehled systémových zdrojů: top, htop, vmstat, mpstat, dstat – co každý ukazuje a očekávané vzory výstupuZde se naučíte číst snímky systémových zdrojů pomocí nástrojů jako top, htop, vmstat, mpstat a dstat. Sekce se zaměřuje na pochopení metrik CPU, paměti a zátěže a rozpoznávání normálních versus patologických vzorů využití.
Key CPU, load, and memory fields in topUsing htop for interactive process analysisvmstat for run queue, swap, and I/O insightmpstat for per-CPU utilization and steal timedstat for combined multi-resource timelinesLekce 6Disk I/O a kontroly souborových systémů: iostat, iotop, sar -d, lsblk, df -h, du -sh, tune2fs, xfs_info – detekce úzkých míst I/O a nízkého prostoruTato sekce se zaměřuje na disk I/O a zdraví souborových systémů pomocí iostat, iotop, sar -d, lsblk, df, du, tune2fs a xfs_info. Naučíte se detekovat saturaci, nahromadění fronty, chyby souborových systémů a stavy nízkého prostoru, které zhoršují výkon.
Using iostat to spot busy and slow devicesUsing iotop to find I/O heavy processessar -d for historical disk utilization trendsChecking layout and types with lsblk and dfFinding space hogs with du and inode checksLekce 7Systémové logy a journaling: journalctl (systemd), /var/log/messages, /var/log/syslog, autentizační logy – co hledat a pročTato sekce vysvětluje, jak používat systemd journalctl a klasické log soubory jako /var/log/messages, /var/log/syslog a autentizační logy. Naučíte se, jaké vzory hledat, jak filtrovat šum a jak logy podporují analýzu kořenových příčin.
journalctl basics and useful filtering optionsReading /var/log/messages and /var/log/syslogFinding errors, warnings, and rate-limited eventsAnalyzing authentication and sudo related logsCorrelating log timestamps with incidentsLekce 8Časově omezené a historické monitorování: sar, sysstat, collectl – sběr a čtení historických metrik k korelaci událostíNaučíte se sbírat a interpretovat historické metriky pomocí sar, sysstat a collectl. Sekce vysvětluje, jak naplánovat sběr dat, číst reporty časových řad a korelovat anomálie výkonu s změnami konfigurace nebo nasazeními.
Enabling and configuring sysstat collectionUsing sar for CPU, memory, and I/O historyReading sar network and load average trendsUsing collectl for multi-resource timelinesCorrelating metrics with change windowsLekce 9Vhledy do jádra a plánovače: dmesg, sysctl -a, parametry /proc/sys/vm – co zprávy jádra a laditelné parametry odhalujíZde prozkoumáte vhledy do jádra a plánovače pomocí dmesg, sysctl a parametrů /proc/sys/vm. Sekce vysvětluje, jak zprávy jádra, laditelné parametry a chování plánovače odhalují problémy hardware, špatné konfigurace a možnosti ladění.
Reading dmesg for hardware and driver issuesListing and querying sysctl tunable valuesKey /proc/sys/vm parameters for memoryScheduler related kernel parameters overviewSafely persisting kernel tuning changesLekce 10Přístup k určení kořenové příčiny: krok za krokem rozhodovací strom k klasifikaci problémů jako CPU, RAM, disk I/O nebo síťTato sekce představuje praktický rozhodovací strom pro analýzu kořenových příčin. Naučíte se klasifikovat incidenty jako CPU, paměť, disk I/O nebo síťově vázané, které nástroje spustit v každé větvi a jak iterativně upravovat hypotézy pomocí shromážděných důkazů.
Initial triage and problem statementClassifying CPU versus I/O bound symptomsDistinguishing memory pressure from leaksIdentifying network versus local bottlenecksIterative hypothesis testing with metrics