שיעור 1פירוש יומנים עבור אפליקציות ווב ושירותי מערכת: /var/log/syslog, /var/log/messages, journald (journalctl), יומנים ספציפיים לאפליקציה ואופן סינון שלהםלמדו לקרוא ולסנן יומנים של לינוקס ומקוס עבור אפליקציות ווב ושירותים. תעבדו עם syslog, journald ויומני אפליקציות, באמצעות journalctl, grep וכלים אחרים כדי לבודד בעיות, לקשר אירועים ולבנות שאילתות יומנים חוזרות.
Syslog layout and common log locationsUsing journalctl filters and time rangesReading web server access and error logsFiltering logs with grep, awk, and sedCorrelating multi-service events by timestampשיעור 2זיהוי וניתוח תהליכים: ps aux, pstree, pmap, lsof, strace — מציאת התהליך הבעייתי ובדיקת התנהגותופתחו טכניקות למציאה ובדיקת תהליכים בעייתיים. באמצעות ps, pstree, pmap, lsof ו-strace, תמיפו היררכיות תהליכים, תבחנו קבצים ופורטים פתוחים, תעקבו אחר קריאות מערכת ותקשרו עליות משאבים ל-PID ספציפיים.
Locating heavy processes with ps and topVisualizing parents and children with pstreeInspecting memory maps using pmapFinding open files and ports with lsofTracing system calls and hangs with straceשיעור 3אבחון רשת בלינוקס: ss, netstat, ip a, ip route, ethtool, ifconfig — אופן קריאת מידע ממשק ומסלולרכשו כישורים לאבחון בעיות רשת בלינוקס ומקוס. תשתמשו ב-ss, netstat, ip, ifconfig ו-ethtool כדי לבדוק sockets, מסלולים וממשקים, לזהות שירותים שמאזינים ולוודא בעיות חיבור ותפוקה.
Listing listening ports with ss and netstatInspecting IP addresses and routes with ipChecking link speed and duplex with ethtoolUsing ifconfig and ip for interface statusDetecting common routing and DNS issuesשיעור 4חקירת I/O דיסק: iostat, iotop, blktrace, בדיקת סוגי מערכת קבצים ואפשרויות הרכבהחקרו צווארי בקבוק I/O של דיסק והתנהגות מערכת קבצים. תשתמשו ב-iostat, iotop ו-blktrace, תבחנו סוגי מערכות קבצים ואפשרויות הרכבה, ותקשרו דפוסי I/O לעומסי אפליקציות ותסמיני השהיה.
Spotting I/O saturation with iostatFinding I/O-heavy processes using iotopTracing block-level activity with blktraceComparing filesystem types and tradeoffsReviewing mount options for performanceשיעור 5פקודות לניטור חי: top, htop, vmstat, iostat, sar, mpstat — דוגמאות שימוש מדויקות ופרשנותחקרו כלי ניטור חיים להבנת התנהגות מערכת בזמן אמת. תשתמשו ב-top, htop, vmstat, iostat, sar ו-mpstat כדי לזהות צווארי בקבוק CPU, זיכרון ו-I/O, לפרש שדות מפתח וללכוד צילומי ביצועים קצרים.
Reading CPU and load in top and htopUsing vmstat for memory and swap insightMonitoring disk I/O with iostat and iotopHistorical snapshots with sar and mpstatExporting command output for later reviewשיעור 6ניתוח ביצועי שרת ווב: מודולי סטטוס nginx/apache, יומני גישה/שגיאות, ניתוח בקשות איטיות, דפוסי סטטוס HTTPלמדו להעריך ביצועי שרת ווב ב-nginx ו-Apache. תקראו מודולי סטטוס, תנתחו יומני גישה ושגיאות, תזהו בקשות איטיות ותפרשו דפוסי סטטוס HTTP כדי להבחין בין בעיות לקוח לצווארי בקבוק שרת.
Enabling and reading nginx status endpointsUsing Apache mod_status and server-statusIdentifying slow requests and timeoutsAnalyzing HTTP status code distributionsDetecting bots, scans, and abusive trafficשיעור 7תיקון ארוך טווח: תכנון קיבולת, מגבלות משאבים (systemd, cgroups), כוונון תצורות kernel ושרת ווב, כלי פרופיילינג אפליקציה ומתי להשתמש בהםתכננו תיקונים ארוכי טווח במקום כיבוי שריפות חוזר. תתרגלו תכנון קיבולת, הגדרת מגבלות משאבים עם systemd ו-cgroups, כוונון פרמטרי kernel ושרת ווב, ובחירת כלי פרופיילינג להנחיית שינויי קוד ותצורה.
Collecting data for capacity planningConfiguring systemd unit resource limitsApplying basic cgroup constraints safelyTuning kernel and web server parametersSelecting and using app profiling toolsשיעור 8הבנת מדדי משאבי מערכת: CPU, זיכרון, I/O, רשת — מה לנטר ולמההבינו מדדי משאבי מערכת מרכזיים ומה הם חושפים על הבריאות. תפרשו מדדי CPU, זיכרון, דיסק ורשת, תלמדו ספים בטוחים ותחליטו אילו מדדים הכי חשובים לעומסי ווב ושירותי רקע.
CPU utilization, load average, and run queuesMemory usage, cache, and swap behaviorDisk throughput, latency, and queue depthNetwork bandwidth, errors, and dropsChoosing alert thresholds for key metricsשיעור 9טכניקות ריכוך זמניות: הפעלה מחדש של שירותים, התאמת niceness תהליך, שחרור מטמונים, הוצאת שירותים מהפעולה בעדינות — פקודות ותוצאות צפויותיישמו טכניקות ריכוך זמניות בטוחות במהלך אירועים. תפעילו מחדש שירותים, תתאימו niceness, תנהלו מטמונים ותוציאו שירותים מהפעולה בעדינות, תבינו פקודות, סיכונים ואימות יעילות הריכוך.
Safely restarting critical servicesAdjusting process priority with nice and reniceFreeing page cache and dentries carefullyPutting web apps into maintenance modeVerifying mitigation impact on metrics