سبق 1ਟ੍ਰੇਸਿੰਗ ਤੇ ਰਿਕਵੈਸਟ ਵਿਜ਼ੀਬਿਲਿਟੀ: OpenTelemetry, Jaeger ਜਾਂ Zipkin ਇੰਟੀਗ੍ਰੇਸ਼ਨ, ਤੇ ਡਿਸਟ੍ਰਿਬਿਊਟਡ ਟ੍ਰੇਸ ਲਈ ਮਾਈਕ੍ਰੋਸਰਵਿਸਿਜ਼ ਨੂੰ ਇੰਸਟ੍ਰੂਮੈਂਟ ਕਰਨਾڈسٹری بیوٹڈ ٹریسنگ فنڈامنٹلز تے OpenTelemetry کونسپٹس سمجھو۔ مائیکرو سروسز نوں ٹریسز تے اسپینز لئے انسٹرومنٹ کرو، Jaeger یا Zipkin نوں ڈیٹا ایکسپورٹ کرو، تے ٹریس ویژولائزیشنز استعمال کر کے رکویسٹس فالو کرو، latency بوٹل نیکس آئیڈنٹیفائی کرو، تے لاگز نال correlate کرو۔
Tracing concepts: spans, context, and samplingAdding OpenTelemetry SDKs to microservicesConfiguring collectors and exporters securelyIntegrating Jaeger or Zipkin backendsUsing traces to locate latency bottlenecksسبق 2ਮੈਟ੍ਰਿਕਸ ਤੇ ਮਾਨੀਟਰਿੰਗ: Prometheus ਸਕ੍ਰੈਪਿੰਗ, ਨੋਡ/ਐਕਸਪੋਰਟਰ, kube-state-metrics, ਤੇ Alertmanager ਨਾਲ ਅਲਰਟਿੰਗ ਤੇ SLO/SLI ਮੇਲPrometheus کیویں Kubernetes ٹارگٹس سکریپ کردا اے، exporters استعمال کردا اے، تے SLI میٹرکس ریکارڈ کردا اے سیکھو۔ Alertmanager راؤٹنگ، انہیبیشن، تے سائلنس کنفیگر کرو، تے کلسٹر تے ایپلیکیشن قابل اعتماد مقصدز نال alerts ملاؤ۔
Configuring Prometheus scrape jobs for KubernetesUsing node-exporter and kube-state-metrics safelyRecording rules and SLI-focused metricsAlertmanager routing, grouping, and inhibitionDefining SLOs and mapping alerts to SLIsسبق 3ਲੌਗਿੰਗ ਸਟੈਕ ਚੋਣ: fluentd/fluent-bit ਕਲੈਕਟਰਜ਼, Elasticsearch/Opensearch ਤੋਂ ਲੌਗ ਫਾਰਵ੍ਰਡਿੰਗ, Loki, ਜਾਂ ਕਲਾਉਡ ਲੌਗ ਸਰਵਿਸਿਜ਼ ਤੇ ਲੌਗ ਰੀਟੇਨਸ਼ਨ ਪਾਲਿਸੀਆਂKubernetes ਲਈ ਲੌਗਿੰਗ ਸਟੈਕਸ ਦੀ ਤੁਲਨਾ ਕਰੋ، ਜਿਨ੍ਹਾਂ ਵਿੱਚ fluentd ਤੇ fluent-bit ਕਲੈਕਟਰ ਸ਼ਾਮਲ ਹਨ। Elasticsearch، OpenSearch، Loki، ਜਾਂ ਕਲਾਉਡ ਸਰਵਿਸਿਜ਼ ਨੂੰ ਲੌਗ ਸ਼ਿਪਿੰਗ ਕੰਫਿਗਰ ਕਰੋ، ਇੰਡੈਕਸਿਜ਼ ਜਾਂ ਟੈਨੈਂਟਸ ਡਿਜ਼ਾਈਨ ਕਰੋ, ਤੇ ਰੀਟੇਨਸ਼ਨ, ਫਿਲਟਰਿੰਗ, ਤੇ ਲਾਗਤ-ਅਜ਼ਾਦ ਸਟੋਰੇਜ ਪਾਲਿਸੀਆਂ ਡਿਫਾਈਨ ਕਰੋ।
Choosing fluentd versus fluent-bit collectorsConfiguring DaemonSet log collectors on nodesForwarding logs to Elasticsearch or OpenSearchShipping logs to Loki or managed cloud loggingDesigning indices, labels, and retention policiesسبق 4ਡੈਸ਼ਬੋਰਡ ਤੇ ਰਨਬੁੱਕਸ: ਕਲੱਸਟਰ ਹੈਲਥ, ਐਪਲੀਕੇਸ਼ਨ KPIs ਲਈ Grafana ਡੈਸ਼ਬੋਰਡਜ਼, ਤੇ ਆਮ ਅਲਰਟਸ ਲਈ ਰਨਬੁੱਕ ਟੈਂਪਲੇਟਸਕਲੱਸਟਰ ਹੈਲਥ, ਨੋਡ ਕੇਪੈਸਿਟੀ, ਤੇ ਐਪਲੀਕੇਸ਼ਨ KPIs ਸਰਫੇਸ ਕਰਨ ਵਾਲੇ Grafana ਡੈਸ਼ਬੋਰਡ ਬਣਾਓ। ਟੈਂਪਲੇਟਿੰਗ ਤੇ ਵੇਰੀਏਬਲਜ਼ ਉਸੇਬ ਕਰੋ, ਅਲਰਟ ਪੈਨਲ ਜੋੜੋ, ਤੇ ਆਮ ਅਲਰਟਸ ਤੇ ਰਿਕਰਿੰਗ ਇਨਸੀਡੈਂਟਸ ਲਈ ਰਨਬੁੱਕਸ ਮੇਂਟੇਨ ਕਰੋ ਜੋ ਕਦਮ, ਕਮਾਂਡਜ਼, ਤੇ ਮਾਲਕਾਂ ਨੂੰ ਡੌਕੂਮੈਂਟ ਕਰਦੇ ਹਨ।
Key cluster and node health dashboard panelsApplication latency, error, and traffic KPIsGrafana templating, variables, and drilldownsAlert panels and linking to external toolsWriting clear, testable runbooks for alertsسبق 5kubectl ਤੇ ਡਾਇਗਨੌਸਟਿਕ ਕਮਾਂਡਜ਼ ਉਸੇਬ: kubectl describe, ਗੈੱਟ ਇਵੈਂਟਸ, ਲੌਗਜ਼, exec, ਪੋਰਟ-ਫਾਰਵਰਡ, ਤੇ ਐਫੀਮਰਲਜ਼ (kubectl ਡਿਬੱਗ) ਉਸੇਬانسائیڈنٹਸ ਲਈ kubectl ਤੇ ਕੋਰ ਡਾਇਗਨੌਸਟਿਕ ਕਮਾਂਡਜ਼ ਮਾਸਟਰ ਕਰੋ। ਵਰਕਲੋਡਜ਼ ਜਾਂਚਣ, ਘਟਨਾਵਾਂ ਇਕੱਠੀਆਂ ਕਰਨ, ਤੇ ਇਸ਼ੂਜ਼ ਦੁਹਰਾਉਣ ਲਈ describe, ਲੌਗਜ਼, exec, ਤੇ ਪੋਰਟ-ਫਾਰਵਰਡ ਉਸੇਬ ਕਰੋ। ਪ੍ਰੋਡਕਸ਼ਨ ਪੋਡਜ਼ ਨੂੰ ਸੁਰੱਖਿਅਤ ਟ੍ਰਬਲਸ਼ੂਟ ਕਰਨ ਲਈ kubectl ਡਿਬੱਗ ਤੇ ਐਫੀਮਰਲ ਕੰਟੇਨਰ ਲਾਗੂ ਕਰੋ।
Using kubectl get and describe effectivelyInspecting events to spot scheduling issuesGathering pod and node logs with kubectl logsRunning kubectl exec and port-forward safelyUsing kubectl debug and ephemeral containersسبق 6ਅਣਪਹੁੰਚੇ ਸਰਵਿਸ ਟ੍ਰਬਲਸ਼ੂਟਿੰਗ: ਸਰਵਿਸ ਐਂਡਪੁਆਇੰਟਸ, ਐਂਡਪੁਆਇੰਟਸਲਾਈਸਿਜ਼, kube-proxy iptables/ipvs ਰੂਲਜ਼, NetworkPolicy ਡਿਨਾਈਜ਼, ਤੇ ਪੋਡਜ਼ ਅੰਦਰ DNS ਰੀਜ਼ੋਲਵਅਣਪਹੁੰਚੇ ਸਰਵਿਸਿਜ਼ ਲਈ ਸਟ੍ਰਕਚਰਡ ਐਪ੍ਰੋਚ ਪ੍ਰੈਕਟਿਸ ਕਰੋ। ਐਂਡਪੁਆਇੰਟਸ ਤੇ ਐਂਡਪੁਆਇੰਟਸਲਾਈਸਿਜ਼ ਜਾਂਚੋ, kube-proxy iptables ਜਾਂ IPVS ਰੂਲਜ਼ ਵੈਰੀਫਾਈ ਕਰੋ, NetworkPolicies ਮੁਲਾਂਕਣ ਕਰੋ, ਤੇ ClusterIP ਤੇ ਹੈੱਡਲੈੱਸ ਸਰਵਿਸਿਜ਼ ਲਈ ਪੋਡਜ਼ ਅੰਦਰ CoreDNS ਕੰਫਿਗਰੇਸ਼ਨ ਤੇ DNS ਰੀਜ਼ੋਲਵ ਸ਼ੁਰੂ ਕਰੋ।
Checking Service selectors, ports, and typesInspecting Endpoints and EndpointSlices objectsValidating kube-proxy mode, rules, and logsTesting NetworkPolicy allows and deniesDebugging DNS resolution from inside podsسبق 7ਪੋਡ ਕਰੈਸ਼ਲੂਪਬੈਕਆਫ ਟ੍ਰਬਲਸ਼ੂਟਿੰਗ: kubelet/ਕੰਟੇਨਰ ਰਨਟਾਈਮ ਲੌਗ ਪੜ੍ਹਨਾ, ਪੋਡ ਇਵੈਂਟਸ ਡਿਸਕ੍ਰਾਈਬ ਕਰਨਾ, liveness/readiness ਪ੍ਰੋਬਜ਼ ਜਾਂਚਣਾ, ਤੇ ਐਫੀਮਰਲ ਡਿਬੱਗ ਕੰਟੇਨਰ ਨਾਲ ਡਿਬੱਗਿੰਗਕਰੈਸ਼ਲੂਪਬੈਕਆਫ ਇਸ਼ੂਜ਼ ਲਈ ਦੁਹਰਾਉਣ ਵਾਲੀ ਵਿਧੀ ਵਿਕਸਿਤ ਕਰੋ। ਪੋਡ ਇਵੈਂਟਸ, ਕੰਟੇਨਰ ਲੌਗਜ਼, ਤੇ kubelet ਮੈਸੇਜਿਜ਼ ਜਾਂਚੋ, ਪ੍ਰੋਬਜ਼ ਤੇ ਰਿਸੋਰਸ ਲਿਮਿਟਸ ਵੈਲੀਡੇਟ ਕਰੋ, ਤੇ ਫਾਈਲਸਿਸਟਮਜ਼, ਐਨਵ, ਤੇ ਸਟਾਰਟਅਪ ਡਿਪੈਂਡੈਂਸੀਜ਼ ਐਕਸਪਲੋਰ ਕਰਨ ਲਈ ਐਫੀਮਰਲ ਡਿਬੱਗ ਕੰਟੇਨਰ ਉਸੇਬ ਕਰੋ।
Reading pod events and status conditionsInspecting container logs and previous attemptsChecking liveness and readiness probe behaviorReviewing resource limits and OOM restartsUsing ephemeral debug containers for analysisسبق 8ਆਨ-ਕਾਲ ਤੇ ਇਨਸੀਡੈਂਟ ਪ੍ਰੋਸੈੱਸ: ਅਲਰਟ ਐਸਕਲੇਸ਼ਨ, ਪੇਜਿੰਗ, ਪਲੇਬੁੱਕਸ, ਤੇ ਰਨਬੁੱਕ-ਚਾਲਿਤ ਰੀਮੀਡੀਏਸ਼ਨ ਕਦਮKubernetes پلیਟਫਾਰਮਜ਼ ਲਈ ਆਨ-ਕਾਲ ਰੋਲ ਵਿੱਚ ਕੰਮ ਕਰਨ ਦਾ ਤਰੀਕਾ ਸਿੱਖੋ। ਐਸਕਲੇਸ਼ਨ ਪਾਤھ, ਪੇਜਿੰਗ ਪਾਲਿਸੀਆਂ, ਤੇ ਸੀਵੀਰٹی ਲੈਵਲ ਡਿਜ਼ਾਈਨ ਕਰੋ, ਪਲੇਬੁੱਕਸ ਤੇ ਰਨਬੁੱਕਸ ਮੇਂਟੇਨ ਕਰੋ, ਤੇ ਭਰੋਸੇਯੋਗੀ ਵਧਾਉਣ ਤੇ ਅਲਰਟ ਥਕਾਵਟ ਘਟਾਉਣ ਲਈ ਪੋਸਟ-ਇਨਸੀਡੈਂਟ ਰੀਵਿਊਜ਼ ਕਰੋ।
Defining severities, SLAs, and escalation pathsConfiguring paging rules and quiet hoursWriting incident playbooks and chat templatesRunbook-driven remediation and verificationPost-incident reviews and follow-up actions