Pelajaran 1Strategi Cadangan: Penuh vs Inkremental, Cadangan DB Logis vs Fisik, Cadangan Filesystem vs Aplikasi, Kebijakan RetensiRancang strategi cadangan untuk server dan database, membandingkan cadangan penuh dan inkremental, metode logis dan fisik, serta pendekatan tingkat filesystem versus aplikasi. Tentukan retensi, enkripsi, dan praktik verifikasi.
Rencana cadangan penuh versus inkrementalCadangan DB logis versus fisikCadangan tingkat filesystem dan aplikasiEnkripsi cadangan dan kontrol aksesJadwal retensi dan kebutuhan hukumPelajaran 2Logging Terpusat: syslog vs logstash vs fluentd, Rotasi Log, Retensi, Strategi Indeks, dan Penentuan Ukuran untuk Aplikasi InternalPelajari cara menyentralisasi log untuk aplikasi internal menggunakan syslog, Logstash, atau Fluentd. Kami membahas pengumpulan log, rotasi, retensi, strategi pengindeksan, dan penentuan ukuran kapasitas untuk mendukung pemecahan masalah dan kebutuhan kepatuhan.
Memilih pengirim dan pengumpul logMerancang format log dan metadataKebijakan rotasi dan retensi logStrategi pengindeksan untuk pencarian cepatMenentukan ukuran penyimpanan dan laju ingestPelajaran 3Merancang Arsitektur 4-Node: Peran dan Pemisahan (2 Server Web, 1 Pekerja Aplikasi, 1 DB, Log/Monitor Terpusat Opsional)Rancang arsitektur empat node praktis dengan pemisahan peran yang jelas. Anda akan menempatkan dua server web, satu pekerja aplikasi, dan satu node database, serta mempertimbangkan penambahan logging dan pemantauan terpusat untuk observabilitas dan ketahanan.
Mendefinisikan peran untuk setiap node serverDesain tier web dan proxy terbalikPola pekerja aplikasi dan antrianPenempatan database dan konektivitasMenambahkan logging dan pemantauan bersamaPelajaran 4Desain Jaringan: Jaringan Privat, Grup Keamanan, Aturan Firewall, NAT, dan Routing antara On-Prem dan CloudPelajari cara merancang jaringan yang aman dan tangguh untuk lingkungan hybrid. Kami membahas subnet privat, grup keamanan, kebijakan firewall, pola NAT, dan routing antara on-premises dan cloud untuk mendukung penerapan server yang dapat diskalakan.
Merancang subnet privat dan publikDesain grup keamanan dan aturan firewallGateway NAT dan akses internet keluarRouting antara VPC on-prem dan cloudSegmentasi jaringan untuk tier aplikasiPelajaran 5Manajemen Patch: Siklus Hidup Paket OS, Alat Manajemen Konfigurasi (Ansible, Puppet, Salt), Jendela Terjadwal dan Rencana RollbackRencanakan dan operasikan manajemen patch untuk sistem operasi dan aplikasi. Pelajari siklus hidup paket, menggunakan Ansible, Puppet, atau Salt, menjadwalkan jendela pemeliharaan, menguji pembaruan, dan menyiapkan rencana rollback dan komunikasi.
Konsep siklus hidup OS dan paketMenggunakan Ansible, Puppet, atau SaltPengujian patch dan lingkungan stagingMenjadwalkan jendela pemeliharaanStrategi rollback dan komunikasiPelajaran 6Kontrol Akses dan Autentikasi: Manajemen Kunci SSH, Pola Host Bastion, Jumpbox, Penempatan VPN, Pertimbangan MFARancang kontrol akses aman untuk server menggunakan kunci SSH, host bastion, dan VPN. Pelajari manajemen siklus hidup kunci, pola jumpbox, integrasi MFA, dan logging akses administratif untuk kepatuhan dan respons insiden.
Generasi dan rotasi kunci SSHPola host bastion dan jumpboxPenempatan VPN dan alur lalu lintasMengintegrasikan MFA untuk akses adminMengaudit dan logging sesi jarak jauhPelajaran 7Pengujian Pemulihan: Latihan Pemulihan, Pemulihan Point-in-Time untuk Database, Konsep RTO/RPO dan Cara Memvalidasi PemulihanPahami cara membuktikan cadangan dapat digunakan melalui pengujian pemulihan terstruktur. Anda akan melatih latihan pemulihan, pemulihan point-in-time database, dan langkah validasi yang selaras dengan target RTO dan RPO untuk layanan internal kritis.
Mendefinisikan tujuan RTO dan RPOMerencanakan dan menjalankan latihan pemulihanMenguji pemulihan point-in-time databaseMemvalidasi pemulihan tingkat aplikasiMendokumentasikan dan meninjau hasil pengujianPelajaran 8Runbook dan Playbook Operasional: Membuat dan Menyimpan Runbook, Manajemen Perubahan, Contoh Runbook untuk Tugas UmumBuat runbook dan playbook operasional efektif untuk tugas rutin dan darurat. Pelajari struktur, penyimpanan, dan kontrol perubahan, serta tinjau contoh konkret untuk penerapan, restart, triase insiden, dan langkah rollback.
Struktur runbook dan detail yang diperlukanVersi dan penyimpanan runbookManajemen perubahan dan persetujuanRunbook untuk tugas pemeliharaan umumPlaybook respons insiden dan eskalasiPelajaran 9Arsitektur Pemantauan dan Peringatan Dasar: Metrik, Log, Trace; Memilih Stack Pemantauan (Prometheus, Grafana, Alertmanager, Nagios, Zabbix)Bangun arsitektur pemantauan dan peringatan dasar menggunakan metrik, log, dan trace. Bandingkan Prometheus, Grafana, Alertmanager, Nagios, dan Zabbix, serta rancang aturan peringatan, dasbor, dan jalur eskalasi untuk layanan internal.
Sinyal metrik, log, dan tracing utamaMemilih stack alat pemantauanMerancang dasbor untuk operatorAturan peringatan, ambang batas, dan kontrol kebisinganKebijakan eskalasi dan alur on-callPelajaran 10Trade-off Ketersediaan Tinggi dan Redundansi untuk Aplikasi Internal Ukuran Menengah (Pemuatan Beban, Sesi Lengket, Penyimpanan Sesi)Jelajahi pola ketersediaan tinggi dan trade-off redundansi untuk aplikasi internal ukuran menengah. Pelajari opsi pemuatan beban, penanganan sesi lengket, penyimpanan sesi eksternal, dan skenario kegagalan untuk menyeimbangkan biaya, kompleksitas, dan waktu aktif.
Mengidentifikasi persyaratan ketersediaanJenis pemuatan beban dan pemeriksaan kesehatanSesi lengket versus desain tanpa statePenyimpanan sesi eksternal dan cachingMode kegagalan dan degradasi anggun