수업 1프로세스 종료, 재시작, 제한 시기: 안전한 kill 관행, systemctl 재시작, cgroups 및 nice/renice 사용프로세스를 종료, 재시작, 제한할 시기와 안전하게 수행하는 방법을 이해하세요. 신호 유형, 안전한 kill 패턴, systemctl 재시작 동작, 영향을 제한하기 위해 cgroups와 nice 또는 renice 적용 방법을 배웁니다.
SIGTERM, SIGKILL 등 선택안전장치와 함께 kill 및 pkill 사용systemctl로 서비스 재시작nice 및 renice로 CPU 제한cgroups로 리소스 제한치료책 문서화 및 자동화수업 2스왑 사용량 및 OOM 이벤트 분석: dmesg, 커널 OOM 킬러 로그, /var/log/kern.logfree, dmesg, 커널 OOM 로그, /var/log/kern.log을 사용하여 스왑 사용량과 메모리 부족 이벤트를 조사하세요. 스래싱 인식, swappiness 튜닝, RAM 추가 또는 제한 조정 시기를 결정하는 방법을 배웁니다.
free 및 /proc으로 스왑 사용량 확인스왑 스래싱 증상 인식dmesg에서 OOM 킬러 항목 읽기/var/log/kern.log 상세 파싱swappiness 및 vm overcommit 튜닝RAM 추가 또는 제한 조정 시기 결정수업 3핫 프로세스 식별: ps, ps aux --sort, pgrep, pidstat 및 PID를 서비스에 매핑ps, pgrep, pidstat, 정렬 옵션을 사용하여 핫 또는 잘못 동작하는 프로세스를 빠르게 식별하세요. PID를 서비스, 유닛, 컨테이너로 매핑하여 리소스 사용과 책임 컴포넌트를 연결합니다.
CPU 및 메모리별 ps 출력 정렬pgrep 및 pkill 이름 필터 사용pidstat으로 프로세스별 통계 모니터링PID를 systemd 유닛에 매핑PID를 컨테이너 또는 cgroups와 연관짧은 수명 버스트 프로세스 추적수업 4반복 리소스 스파이크 식별: cron, systemd 타이머, at 작업, 애플리케이션 스케줄러 검사메트릭을 예약된 작업과 상관관계하여 반복되는 CPU, 메모리, I/O 스파이크를 감지하는 방법을 탐구하세요. cron, systemd 타이머, at 작업, 앱 내 스케줄러를 검사하여 소음이 많거나 겹치는 작업을 찾아 수정합니다.
사용자 및 시스템 crontab 나열 및 읽기systemd 타이머 및 캘린더 유닛 검사at 작업 및 일회성 일정 검토앱 수준 스케줄러 및 워커 추적스파이크와 작업 실행 시간 상관관계소음이 많은 반복 작업 정제 또는 분산수업 5메모리 문제 해결: free, /proc/meminfo, smem, pmap 및 메모리 누수 확인free, /proc/meminfo, smem, pmap을 사용하여 메모리 문제를 해결하는 기술을 습득하세요. 캐시와 실제 압력을 구분하고, 프로세스별 사용량을 찾으며, 메모리 누수 또는 조각화를 나타내는 패턴을 인식합니다.
free 및 사용 가능 메모리 해석/proc/meminfo 주요 필드 읽기smem으로 프로세스별 분석pmap으로 프로세스 맵 검사메모리 누수 성장 패턴 발견캐시와 실제 압력 구분수업 6모니터링 데이터(Prometheus, Grafana) 통합 및 역사적 메트릭을 사용한 트렌드 결정로컬 문제 해결과 Prometheus, Grafana 데이터를 결합하는 방법을 배웁니다. 역사적 메트릭, 대시보드, 알림을 사용하여 트렌드, 회귀, 느린 드리프트를 식별하고 성능 수정의 영향을 검증합니다.
주요 CPU 및 로드 대시보드 검토메모리, 캐시, 스왑 패널 검사디스크 및 네트워크 지연 그래프 분석PromQL로 역사적 메트릭 슬라이싱배포와 메트릭 변경 상관관계전후 뷰로 수정 검증수업 7로드 vs CPU 포화: uptime, 로드 평균 해석 및 CPU 코어와의 관계시스템 로드 평균의 의미와 CPU 코어, 실행 큐와의 관계를 명확히 하세요. 건강한 높은 로드와 CPU 포화를 구분하고, 로드를 I/O 대기, 컨텍스트 스위치, 지연과 상관관계짓는 방법을 배웁니다.
uptime 및 로드 평균 읽기로드와 CPU 코어 수 연관실행 가능 및 차단 작업 분리CPU 중심 포화 사례 식별I/O 대기 주도 로드 인식vmstat 및 mpstat으로 확인수업 8실시간 시스템 메트릭 수집: top, htop, vmstat, mpstat, iostat 및 출력 해석top, htop, vmstat, mpstat, iostat을 사용하여 실시간 리눅스 성능 메트릭을 수집하고 해석하세요. CPU, 메모리, I/O 뷰, 주요 필드, 갱신 간격, 실시간 병목 현상을 발견하는 방법을 이해합니다.
top 및 htop에서 CPU 사용량 읽기top에서 메모리 및 스왑 모니터링vmstat으로 시스템 전체 스냅샷mpstat으로 CPU 통계 분석iostat으로 디스크 I/O 패턴 확인샘플링 간격 및 필터 선택수업 9perf, strace, ltrace를 사용한 심층 프로세스 분석 및 각 도구 사용 시기심층 프로세스 분석을 위해 perf, strace, ltrace를 언제 어떻게 사용하는지 이해하세요. CPU 핫스팟 프로파일링, 시스템 콜 추적, 라이브러리 콜 검사, 실행 가능한 진단을 캡처하면서 오버헤드를 최소화합니다.
perf record로 CPU 핫스팟 프로파일링perf 보고서 및 콜 그래프 보기strace로 안전한 시스템콜 추적strace 출력 노이즈 필터링ltrace로 라이브러리 콜 검사증상에 맞는 도구 선택수업 10경량 프로파일링 및 추적 도구(py-spy, gdb, flamegraphs)를 사용한 Python 앱py-spy, gdb, flamegraphs를 사용하여 Python 애플리케이션의 경량 프로파일링과 추적에 중점을 둡니다. 프로덕션에서 스택 샘플 캡처, 핫 코드 경로 위치, 서비스 중지 없이 flamegraphs 해석을 수행합니다.
py-spy로 Python 스택 샘플링flamegraphs 생성 및 읽기실행 중 Python에 gdb 안전 연결스트립되거나 최적화된 빌드 처리비동기 및 멀티스레드 코드 프로파일링프로덕션에서 프로파일러 오버헤드 감소