1 වන පාඩමබැකප් උපාය මාර්ග: full vs incremental, logical vs physical DB backups, filesystem vs application backups, retention policiesසේවාදායක සහ දත්ත සමුදායන් සඳහා බැකප් උපාය මාර්ග සැලසුම් කරන්න, full සහ incremental backups, logical සහ physical ක්රම සංසන්දනය කරමින්, filesystem vs application-level ප්රවේශයන්. Retention, encryption සහ verification පුරුදු නිර්වචනය කරන්න.
Full vs incremental බැකප් සැලසුම්Logical vs physical DB backupsFilesystem සහ application-level backupsබැකප් encryption සහ ප්රවේශ පාලනයRetention schedules සහ නීතිමය අවශ්යතා2 වන පාඩමකේන්ද්රීයකරණ ලොගින්: syslog vs logstash vs fluentd, log rotation, retention, index strategies, internal app සඳහා sizingInternal app සඳහා syslog, Logstash හෝ Fluentd භාවිතයෙන් ලොග් කේන්ද්රීයකරණය කිරීම ඉගෙන ගන්න. Log collection, rotation, retention, indexing strategies සහ troubleshooting සහ අනුකූලතා අවශ්යතා සඳහා capacity sizing ආවරණය කරමු.
Log shippers සහ collectors තේරීමLog formats සහ metadata සැලසුම්Log rotation සහ retention policiesවේගවත් සෙවීම සඳහා indexing strategiesStorage සහ ingestion rates sizing3 වන පාඩම4-node ආකෘතිය සැලසුම්: roles සහ වෙන්කිරීම (2 web servers, 1 app worker, 1 DB, optional central log/monitor)පැහැදිලි role වෙන්කිරීම සහිත ප්රායෝගික four-node ආකෘතියක් සැලසුම් කරන්න. දෙක web servers, එක application worker සහ එක database node තබන්න, observability සහ resilience සඳහා කේන්ද්රීය ලොගින් සහ නිරීක්ෂණය එකතු කිරීම සලකන්න.
එක් එක් server node සඳහා roles නිර්වචනයWeb tier සැලසුම් සහ reverse proxiesApplication worker patterns සහ queuesDatabase placement සහ connectivityShared logging සහ monitoring එකතු කිරීම4 වන පාඩමජාල සැලසුම්: private networks, security groups, firewall rules, NAT, on-prem සහ cloud අතර routingHybrid පරිසර සඳහා ආරක්ෂිත, ඉහළ ලබාගත හැකි ජාල සැලසුම් කිරීම ඉගෙන ගන්න. Private subnets, security groups, firewall policies, NAT patterns සහ scalable server deployments සඳහා on-premises සහ cloud අතර routing ආවරණය කරමු.
Private සහ public subnets සැලසුම්Security groups සහ firewall rule සැලසුම්NAT gateways සහ outbound internet ප්රවේශයOn-prem සහ cloud VPCs අතර routingApp tiers සඳහා ජාල segmentation5 වන පාඩමPatch කළමනාකරණය: OS package lifecycle, configuration management tools (Ansible, Puppet, Salt), scheduled windows සහ rollback plansOperating systems සහ යෙදුම් සඳහා patch කළමනාකරණය සැලසුම් කරන්න සහ ක්රියාකාරකම් කරන්න. Package lifecycles, Ansible, Puppet හෝ Salt භාවිතය, maintenance windows scheduling, updates testing සහ rollback සහ communication plans සූදානම් කිරීම ඉගෙන ගන්න.
OS සහ package lifecycle සංකල්පAnsible, Puppet හෝ Salt භාවිතයPatch testing සහ staging environmentsMaintenance windows schedulingRollback strategies සහ communication6 වන පාඩමප්රවේශ පාලනය සහ authentication: SSH යතුර කළමනාකරණය, bastion host patterns, jumpboxes, VPN placement, MFA සලකා බැලීම්SSH යතුරු, bastion hosts සහ VPNs භාවිතයෙන් සේවාදායක සඳහා ආරක්ෂිත ප්රවේශ පාලනය සැලසුම් කරන්න. Key lifecycle කළමනාකරණය, jumpbox patterns, MFA integration සහ compliance සහ incident response සඳහා administrative ප්රවේශ ලොගින් ඉගෙන ගන්න.
SSH යතුර ජනනය සහ rotationBastion hosts සහ jumpbox patternsVPN placement සහ traffic flowsAdmin ප්රවේශය සඳහා MFA integrationRemote sessions auditing සහ logging7 වන පාඩමRestore testing: recovery drills, point-in-time restore DB සඳහා, RTO/RPO සංකල්ප සහ restores වලංගු කිරීමබැකප් භාවිතා කළ හැකි බව ඔප්පු කිරීමට structured restore testing හරහා තේරුම් ගන්න. Recovery drills, database point-in-time restores සහ critical internal services සඳහා RTO සහ RPO targets සමඟ align වූ validation steps පුහුණු කරන්න.
RTO සහ RPO objectives නිර්වචනයRecovery drills සැලසුම් කිරීම සහ ධාවනයDatabase point-in-time restores testingApplication-level restores වලංගු කිරීමTest results ලේඛනගත කිරීම සහ සමාලෝචනය8 වන පාඩමRunbooks සහ operational playbooks: runbooks සෑදීම සහ ගබඩා කිරීම, change management, common tasks සඳහා runbook examplesRoutine සහ emergency tasks සඳහා effective runbooks සහ operational playbooks සාදන්න. Structure, storage සහ change control ඉගෙන ගන්න, deployments, restarts, incident triage සහ rollback steps සඳහා concrete examples සමාලෝචනය කරන්න.
Runbook structure සහ අවශ්ය විස්තරRunbooks versioning සහ ගබඩා කිරීමChange management සහ approvalsCommon maintenance tasks සඳහා runbooksIncident response සහ escalation playbooks9 වන පාඩමමූලික නිරීක්ෂණය සහ alerting ආකෘතිය: metrics, logs, traces; monitoring stack තේරීම (Prometheus, Grafana, Alertmanager, Nagios, Zabbix)Metrics, logs සහ traces භාවිතයෙන් මූලික monitoring සහ alerting ආකෘතියක් සාදන්න. Prometheus, Grafana, Alertmanager, Nagios සහ Zabbix සංසන්දනය කරන්න, internal services සඳහා alert rules, dashboards සහ escalation paths සැලසුම් කරන්න.
Key metrics, logs සහ tracing signalsMonitoring tool stack තේරීමOperators සඳහා dashboards සැලසුම්Alert rules, thresholds සහ noise controlEscalation policies සහ on-call flows10 වන පාඩමMid-size internal app සඳහා high-availability සහ redundancy tradeoffs (load balancing, sticky sessions, session stores)Mid-size internal app සඳහා high-availability patterns සහ redundancy tradeoffs ගවේෂණය කරන්න. Load balancing options, sticky sessions handling, external session stores සහ failure scenarios ඉගෙන ගන්න එවිට cost, complexity සහ uptime සමබර කළ හැකිය.
Availability requirements හඳුනාගැනීමLoad balancer types සහ health checksSticky sessions vs stateless designExternal session stores සහ cachingFailure modes සහ graceful degradation