שיעור 1ניתוח זיכרון: free -m, /proc/meminfo, slabtop, smem—פרשנות זיכרון בשימוש לעומת זמין והתנהגות swapכאן תנתחו התנהגות זיכרון באמצעות free, /proc/meminfo, slabtop ו-smem. הפרק מסביר מטמון לינוקס, buffers ו-reclaim, כיצד לפרש שימוש ב-swap, וכיצד לזהות דליפות זיכרון, פרגמנטציה ומגבלות לא מוגדרות נכון.
Reading free -m and understanding cached memoryKey fields in /proc/meminfo for diagnosisUsing slabtop to inspect kernel slab usageUsing smem to attribute memory per processRecognizing swap thrashing and OOM risksשיעור 2שימוש ברשת ופקקים: iftop, nload, ss, netstat, ip -s link, tc, tcpdump—זיהוי רוויה ברשת וחיבורים בעייתייםפרק זה מכסה אבחון שימוש ברשת ופקקים באמצעות iftop, nload, ss, ip, tc ו-tcpdump. תלמדו לזהות רוויה, שכנים רועשים, מצבי חיבור ובעיות ברמת חבילות שתורמות ליישומים איטיים.
Monitoring live bandwidth with iftop and nloadInspecting sockets and states with ssUsing ip -s link to view interface errorsBasics of tc for shaping and rate limitingTargeted packet capture with tcpdumpשיעור 3השהיית אחסון וקלט/פלט מעמיק: blktrace, bpftrace (סקריפטים בסיסיים), fio לבדיקות—כיצד למדוד ולפרש השהיה ותפוקהפרק זה מכסה השהיית אחסון וניתוח קלט/פלט מעמיק באמצעות blktrace, סקריפטים בסיסיים של bpftrace ובדיקות fio. תלמדו למדוד השהיה ותפוקה, לפרש עומק תור ולזהות מגבלות התקן לעומת בעיות עומס.
Understanding latency, IOPS, and throughputUsing blktrace to inspect block I/O patternsIntroductory bpftrace scripts for disk latencyDesigning fio workloads that mimic productionReading fio reports and spotting bottlenecksשיעור 4חקירת תהליכים: ps, מסנני top/htop, pgrep, pidstat, nice/renice—כיצד למצוא תהליכים כבדי CPU וזיכרוןתלמדו לחקור תהליכים עם ps, מסנני top או htop, pgrep, pidstat ו-nice או renice. הפרק מראה כיצד לזהות משימות כבדות CPU וזיכרון, לעקוב אחר קלט/פלט לתהליך ולשנות עדיפויות כדי להפחית תחרות.
Listing and filtering processes with psUsing pgrep and pkill safely and preciselyUsing pidstat for per process CPU and I/OFiltering top and htop by user or resourceAdjusting priorities with nice and reniceשיעור 5סקירה כללית של משאבי מערכת: top, htop, vmstat, mpstat, dstat—מה כל אחד מציג ודפוסי פלט צפוייםכאן תלמדו לקרוא צילומי משאבים כלליים באמצעות כלים כמו top, htop, vmstat, mpstat ו-dstat. הפרק מתמקד בהבנת מדדי CPU, זיכרון ועומס, וזיהוי דפוסי שימוש נורמליים לעומת פתולוגיים.
Key CPU, load, and memory fields in topUsing htop for interactive process analysisvmstat for run queue, swap, and I/O insightmpstat for per-CPU utilization and steal timedstat for combined multi-resource timelinesשיעור 6קלט/פלט דיסק ובדיקות מערכת קבצים: iostat, iotop, sar -d, lsblk, df -h, du -sh, tune2fs, xfs_info—זיהוי פקקי קלט/פלט ומקום נמוךפרק זה מתמקד בקלט/פלט דיסק ובדיקות מערכת קבצים באמצעות iostat, iotop, sar -d, lsblk, df, du, tune2fs ו-xfs_info. תלמדו לזהות רוויה, הצטברות תורים, שגיאות מערכת קבצים ותנאי מקום נמוך שפוגעים בביצועים.
Using iostat to spot busy and slow devicesUsing iotop to find I/O heavy processessar -d for historical disk utilization trendsChecking layout and types with lsblk and dfFinding space hogs with du and inode checksשיעור 7לוגי מערכת ויומנים: journalctl (systemd), /var/log/messages, /var/log/syslog, לוגי אימות—מה לחפש ולמהפרק זה מסביר כיצד להשתמש ב-journalctl של systemd וקבצי לוג קלאסיים כמו /var/log/messages, /var/log/syslog ולוגי אימות. תלמדו אילו דפוסים לחפש, כיצד לסנן רעש וכיצד לוגים תומכים בניתוח סיבת שורש.
journalctl basics and useful filtering optionsReading /var/log/messages and /var/log/syslogFinding errors, warnings, and rate-limited eventsAnalyzing authentication and sudo related logsCorrelating log timestamps with incidentsשיעור 8ניטור מבוסס זמן והיסטורי: sar, sysstat, collectl—איסוף וקריאת מדדים היסטוריים לקישור אירועיםתלמדו לאסוף ולפרש מדדים היסטוריים באמצעות sar, sysstat ו-collectl. הפרק מסביר כיצד לתזמן איסוף נתונים, לקרוא דוחות סדרות זמן ולקשר אי-סדירויות ביצועים עם שינויי תצורה או פריסות.
Enabling and configuring sysstat collectionUsing sar for CPU, memory, and I/O historyReading sar network and load average trendsUsing collectl for multi-resource timelinesCorrelating metrics with change windowsשיעור 9תובנות גרעין ותזמון: dmesg, sysctl -a, פרמטרי /proc/sys/vm—מה הודעות גרעין ופרמטרים מתכווננים חושפיםכאן תחקרו תובנות גרעין ותזמון באמצעות dmesg, sysctl ופרמטרי /proc/sys/vm. הפרק מסביר כיצד הודעות גרעין, פרמטרים מתכווננים והתנהגות תזמון חושפים בעיות חומרה, תצורות שגויות ואפשרויות כוונון.
Reading dmesg for hardware and driver issuesListing and querying sysctl tunable valuesKey /proc/sys/vm parameters for memoryScheduler related kernel parameters overviewSafely persisting kernel tuning changesשיעור 10גישה לקביעת סיבת שורש: עץ החלטות צעד אחר צעד לסיווג בעיות כ-CPU, RAM, קלט/פלט דיסק או רשתפרק זה מציג עץ החלטות מעשי לניתוח סיבת שורש. תלמדו לסווג אירועים כ-CPU, זיכרון, קלט/פלט דיסק או רשת מוגבלים, אילו כלים להריץ בכל ענף וכיצד לחדד השערות באופן איטרטיבי באמצעות ראיות שנאספו.
Initial triage and problem statementClassifying CPU versus I/O bound symptomsDistinguishing memory pressure from leaksIdentifying network versus local bottlenecksIterative hypothesis testing with metrics