Aralin 1Kailan pupuksain, i-restart, o i-throttle ang isang proseso: ligtas na kill practices, systemctl restart, at paggamit ng cgroups at nice/reniceUnawain kung kailan pupuksain, i-restart, o i-throttle ang isang proseso at kung paano gawin ito nang ligtas. Matututunan mo ang mga uri ng signal, ligtas na kill patterns, pag-uugali ng systemctl restart, at kung paano maglagay ng cgroups at nice o renice upang limitahan ang epekto.
Pagpili ng SIGTERM, SIGKILL, at iba paPaggamit ng kill at pkill na may safeguardsPagre-restart ng mga serbisyo gamit ang systemctlPagthrottle ng CPU gamit ang nice at renicePaglilimita ng resources gamit ang cgroupsPagdokumenta at pag-automate ng mga remedyoAralin 2Pagsusuri ng paggamit ng swap at OOM events: dmesg, kernel OOM killer logs, at /var/log/kern.logSuriin ang paggamit ng swap at Out Of Memory events gamit ang free, dmesg, kernel OOM logs, at /var/log/kern.log. Matututunan mo ang pagkilala sa thrashing, pagtune ng swappiness, at pagdedesisyon kung kailan magdagdag ng RAM o i-adjust ang mga limit.
Pagsusuri ng paggamit ng swap gamit ang free at /procPagkilala sa mga sintomas ng swap thrashingPagbasa ng dmesg para sa OOM killer entriesPag-parse ng /var/log/kern.log detailsPagtune ng swappiness at vm overcommitPagdedesisyon kung kailan magdagdag ng RAM o i-adjust ang mga limitAralin 3Pagkilala sa mga hot processes: ps, ps aux --sort, pgrep, pidstat at pagmama-map ng PIDs sa mga serbisyoMatututunan mo ang mabilis na pagkilala sa mga hot o misbehaving processes gamit ang ps, pgrep, pidstat, at sorting options. I-map ang mga PID pabalik sa mga serbisyo, units, at containers upang ikonekta ang paggamit ng resource sa mga responsable na components.
Pag-sort ng ps output ayon sa CPU at memoryPaggamit ng pgrep at pkill name filtersPagsubaybay sa per-process stats gamit ang pidstatPagmama-map ng PIDs sa systemd unitsPag-relate ng PIDs sa containers o cgroupsPagtatrabaho ng short-lived bursty processesAralin 4Pagkilala sa mga paulit-ulit na resource spikes: pagsusuri ng cron, systemd timers, at jobs, at application schedulersGalugarin ang mga paraan upang matuklasan ang mga paulit-ulit na CPU, memory, at I/O spikes sa pamamagitan ng pag-correlate ng metrics sa mga scheduled tasks. Suriin ang cron, systemd timers, at jobs, at in-app schedulers upang hanapin at ayusin ang mga maingay o overlapping jobs.
Paglista at pagbasa ng user at system crontabsPagsusuri ng systemd timers at calendar unitsPagre-review ng at jobs at one-off schedulesPag-trace ng app-level schedulers at workersPag-correlate ng spikes sa job execution timesPagre-refine o pagstagger ng maingay na paulit-ulit na jobsAralin 5Pag-troubleshoot ng Memory: free, /proc/meminfo, smem, pmap at pagsusuri ng memory leaksMakakakuha ka ng mga kasanayan upang mag-troubleshoot ng mga isyu sa memory gamit ang free, /proc/meminfo, smem, at pmap. Matututunan mo ang pagkakaiba ng cache mula sa real pressure, paghahanap ng per-process usage, at pagkilala sa mga pattern na nagpapahiwatig ng memory leaks o fragmentation.
Pag-interpret ng free at available memoryPagbasa ng /proc/meminfo key fieldsPaggamit ng smem para sa per-process breakdownsPagsusuri ng process maps gamit ang pmapPag-spot ng memory leak growth patternsPagkakaiba ng cache mula sa real pressureAralin 6Pag-integrate sa monitoring data (Prometheus, Grafana) at paggamit ng historical metrics upang matukoy ang mga trendMatututunan mo ang pag-combine ng local troubleshooting sa data ng Prometheus at Grafana. Gamitin ang historical metrics, dashboards, at alerts upang makilala ang mga trend, regressions, at slow drifts, at upang i-validate ang epekto ng mga pag-aayos sa performance.
Pagre-review ng key CPU at load dashboardsPagsusuri ng memory, cache, at swap panelsPagsusuri ng disk at network latency graphsPaggamit ng PromQL upang slice ang historical metricsPag-correlate ng deploys sa metric changesPag-validate ng mga pag-aayos gamit ang before at after viewsAralin 7Load vs CPU saturation: uptime, load average interpretation at relasyon sa CPU coresIpaliwanag ang kahulugan ng system load averages at kanilang relasyon sa CPU cores at run queues. Matututunan mo ang pagkakaiba ng malusog na high load mula sa CPU saturation, at pag-correlate ng load sa I/O wait, context switches, at latency.
Pagbasa ng uptime at load averagesPag-relate ng load sa CPU core countsPaghiwa-hiwalay ng runnable at blocked tasksPagkilala sa CPU-bound saturation casesPagkilala sa I/O wait driven loadPaggamit ng vmstat at mpstat upang kumpirmahinAralin 8Pagkolekta ng live system metrics: top, htop, vmstat, mpstat, iostat at kung paano interpret ang mga outputMatututunan mo ang pagkolekta at pag-interpret ng live Linux performance metrics gamit ang top, htop, vmstat, mpstat, at iostat. Unawain ang CPU, memory, at I/O views, key fields, refresh intervals, at kung paano makita ang mga bottlenecks sa real time.
Pagbasa ng CPU usage sa top at htopPagsubaybay sa memory at swap sa topPaggamit ng vmstat para sa system-wide snapshotsPagsusuri ng CPU stats gamit ang mpstatPagsusuri ng disk I/O patterns gamit ang iostatPagpili ng sampling intervals at filtersAralin 9Paggamit ng perf, strace, at ltrace para sa malalim na pagsusuri ng proseso at kailan gagamitin ang bawat isaUnawain kung kailan at kung paano gamitin ang perf, strace, at ltrace para sa malalim na pagsusuri ng proseso. Matututunan mo ang pag-profile ng CPU hotspots, pag-trace ng system calls, pagsusuri ng library calls, at pag-minimize ng overhead habang nakakakuha ng actionable diagnostics.
Pag-profile ng CPU hotspots gamit ang perf recordPagtingin ng perf reports at call graphsPag-trace ng syscalls gamit ang strace nang ligtasPag-filter ng maingay na strace outputPagsusuri ng library calls gamit ang ltracePagpili ng tamang tool para sa bawat sintomasAralin 10Paggamit ng lightweight profiling at tracing tools (py-spy, gdb, flamegraphs) para sa Python appsFokus sa lightweight profiling at tracing para sa mga Python applications gamit ang py-spy, gdb, at flamegraphs. Kunin ang stack samples sa production, hanapin ang hot code paths, at interpret ang flamegraphs nang hindi pinipigilan ang mga serbisyo.
Pag-sample ng Python stacks gamit ang py-spyPag-generate at pagbasa ng flamegraphsPag-attach ng gdb nang ligtas sa live PythonPaghandle ng stripped o optimized buildsPag-profile ng async at multithreaded codePagbawas ng profiler overhead sa production