Pelajaran 1Analisis memori: free -m, /proc/meminfo, slabtop, smem—mentafsir memori digunakan vs tersedia dan tingkah laku swapDi sini anda akan menganalisis tingkah laku memori menggunakan free, /proc/meminfo, slabtop, dan smem. Bahagian ini menerangkan pengecapan Linux, buffer, dan pemulihan, cara mentafsir penggunaan swap, dan cara mengesan kebocoran memori, pecahan, dan had yang salah konfigurasi.
Reading free -m and understanding cached memoryKey fields in /proc/meminfo for diagnosisUsing slabtop to inspect kernel slab usageUsing smem to attribute memory per processRecognizing swap thrashing and OOM risksPelajaran 2Penggunaan rangkaian dan sabot air: iftop, nload, ss, netstat, ip -s link, tc, tcpdump—mengenal pasti ketepuan rangkaian dan sambungan bermasalahBahagian ini meliputi diagnosis penggunaan rangkaian dan sabot air menggunakan iftop, nload, ss, ip, tc, dan tcpdump. Anda akan belajar mengenal pasti ketepuan, jiran bising, keadaan sambungan, dan isu tahap paket yang menyumbang kepada aplikasi perlahan.
Monitoring live bandwidth with iftop and nloadInspecting sockets and states with ssUsing ip -s link to view interface errorsBasics of tc for shaping and rate limitingTargeted packet capture with tcpdumpPelajaran 3Latensi storan dan I/O lebih mendalam: blktrace, bpftrace (skrip asas), fio untuk ujian—cara mengukur dan mentafsir latensi dan throughputBahagian ini meliputi latensi storan dan analisis I/O lebih mendalam menggunakan blktrace, skrip bpftrace asas, dan penanda aras fio. Anda akan belajar mengukur latensi dan throughput, mentafsir kedalaman barisan, dan membezakan had peranti daripada isu beban kerja.
Understanding latency, IOPS, and throughputUsing blktrace to inspect block I/O patternsIntroductory bpftrace scripts for disk latencyDesigning fio workloads that mimic productionReading fio reports and spotting bottlenecksPelajaran 4Siasatan proses: ps, penapis top/htop, pgrep, pidstat, nice/renice—cara mencari proses berat CPU dan memoriAnda akan belajar menyiasat proses dengan ps, penapis top atau htop, pgrep, pidstat, dan nice atau renice. Bahagian ini menunjukkan cara mengenal pasti tugas berat CPU dan memori, menjejaki I/O setiap proses, dan melaraskan keutamaan untuk mengurangkan pertandingan.
Listing and filtering processes with psUsing pgrep and pkill safely and preciselyUsing pidstat for per process CPU and I/OFiltering top and htop by user or resourceAdjusting priorities with nice and renicePelajaran 5Gambaran sumber sistem: top, htop, vmstat, mpstat, dstat—apa yang setiap satu tunjukkan dan corak output yang dijangkaDi sini anda akan belajar membaca snap sumber sistem secara meluas menggunakan alat seperti top, htop, vmstat, mpstat, dan dstat. Bahagian ini memberi tumpuan kepada memahami metrik CPU, memori, dan beban, serta mengenali corak penggunaan normal berbanding patologikal.
Key CPU, load, and memory fields in topUsing htop for interactive process analysisvmstat for run queue, swap, and I/O insightmpstat for per-CPU utilization and steal timedstat for combined multi-resource timelinesPelajaran 6I/O cakera dan pemeriksaan sistem fail: iostat, iotop, sar -d, lsblk, df -h, du -sh, tune2fs, xfs_info—mengesan sabot air I/O dan ruang rendahBahagian ini memberi tumpuan kepada I/O cakera dan kesihatan sistem fail menggunakan iostat, iotop, sar -d, lsblk, df, du, tune2fs, dan xfs_info. Anda akan belajar mengesan ketepuan, penumpukan barisan, ralat sistem fail, dan keadaan ruang rendah yang merosakkan prestasi.
Using iostat to spot busy and slow devicesUsing iotop to find I/O heavy processessar -d for historical disk utilization trendsChecking layout and types with lsblk and dfFinding space hogs with du and inode checksPelajaran 7Log sistem dan jurnal: journalctl (systemd), /var/log/messages, /var/log/syslog, log autentikasi—apa yang dicari dan mengapaBahagian ini menerangkan cara menggunakan systemd journalctl dan fail log klasik seperti /var/log/messages, /var/log/syslog, dan log autentikasi. Anda akan belajar corak apa yang dicari, cara menapis bunyi, dan bagaimana log menyokong analisis punca akar.
journalctl basics and useful filtering optionsReading /var/log/messages and /var/log/syslogFinding errors, warnings, and rate-limited eventsAnalyzing authentication and sudo related logsCorrelating log timestamps with incidentsPelajaran 8Pemantauan berasaskan masa dan sejarah: sar, sysstat, collectl—mengumpul dan membaca metrik sejarah untuk mengaitkan peristiwaAnda akan belajar mengumpul dan mentafsir metrik sejarah menggunakan sar, sysstat, dan collectl. Bahagian ini menerangkan cara menjadualkan pengumpulan data, membaca laporan siri masa, dan mengaitkan anomali prestasi dengan perubahan konfigurasi atau pelaksanaan.
Enabling and configuring sysstat collectionUsing sar for CPU, memory, and I/O historyReading sar network and load average trendsUsing collectl for multi-resource timelinesCorrelating metrics with change windowsPelajaran 9Pandangan kernel dan penjadual: dmesg, sysctl -a, parameter /proc/sys/vm—apa mesej kernel dan boleh laras dedahkanDi sini anda akan meneroka pandangan kernel dan penjadual menggunakan dmesg, sysctl, dan parameter /proc/sys/vm. Bahagian ini menerangkan bagaimana mesej kernel, boleh laras, dan tingkah laku penjadual mendedahkan isu perkakasan, salah konfigurasi, dan pilihan penalaan.
Reading dmesg for hardware and driver issuesListing and querying sysctl tunable valuesKey /proc/sys/vm parameters for memoryScheduler related kernel parameters overviewSafely persisting kernel tuning changesPelajaran 10Pendekatan kepada penentuan punca akar: pokok keputusan langkah demi langkah untuk mengklasifikasikan isu sebagai CPU, RAM, I/O cakera, atau rangkaianBahagian ini membentangkan pokok keputusan praktikal untuk analisis punca akar. Anda akan belajar mengklasifikasikan insiden sebagai terikat CPU, memori, I/O cakera, atau rangkaian, alat mana yang dijalankan dalam setiap cabang, dan cara menyempurnakan hipotesis secara iteratif menggunakan bukti yang dikumpul.
Initial triage and problem statementClassifying CPU versus I/O bound symptomsDistinguishing memory pressure from leaksIdentifying network versus local bottlenecksIterative hypothesis testing with metrics