Lecția 1Strategii de backup: complet vs incremental, backup-uri logice vs fizice DB, backup-uri fișiere vs aplicație, politici de retențieProiectează strategii de backup pentru servere și baze de date, comparând backup-urile complete și incrementale, metodele logice și fizice, și abordările la nivel de fișiere versus aplicație. Definește retenția, criptarea și practicile de verificare.
Planuri de backup complet versus incrementalBackup-uri DB logice versus fiziceBackup-uri la nivel de fișiere și aplicațieCriptarea backup-urilor și controlul accesuluiPrograme de retenție și nevoi legaleLecția 2Jurnalizare centralizată: syslog vs logstash vs fluentd, rotație log, retenție, strategii indexare și dimensionare pentru o aplicație internăÎnvață cum să centralizezi logurile pentru o aplicație internă folosind syslog, Logstash sau Fluentd. Acoperim colectarea logurilor, rotația, retenția, strategiile de indexare și dimensionarea capacității pentru a susține depanarea și nevoile de conformitate.
Alegerea expeditorilor și colectorilor de loguriProiectarea formatelor de loguri și metadatelorPolitici de rotație și retenție loguriStrategii de indexare pentru căutări rapideDimensionarea stocării și ratelor de ingiereLecția 3Proiectarea unei arhitecturi cu 4 noduri: roluri și separare (2 servere web, 1 worker aplicație, 1 DB, log/monitor central opțional)Proiectează o arhitectură practică cu patru noduri cu separare clară a rolurilor. Vei plasa două servere web, un worker de aplicație și un nod de bază de date, și vei considera adăugarea jurnalizării și monitorizării centralizate pentru observabilitate și reziliență.
Definirea rolurilor pentru fiecare nod de serverDesign tier web și proxy reverseModele worker aplicație și coziPlasarea bazei de date și conectivitateAdăugarea jurnalizării și monitorizării partajateLecția 4Design rețea: rețele private, grupuri securitate, reguli firewall, NAT, rutare între on-prem și cloudÎnvață cum să proiectezi rețele sigure și rezistente pentru medii hibride. Acoperim subrețele private, grupuri de securitate, politici firewall, modele NAT și rutare între on-prem și cloud pentru a susține implementări scalabile de servere.
Proiectarea subrețelelor private și publiceDesign grupuri securitate și reguli firewallGateway-uri NAT și acces internet outboundRutare între VPC-uri on-prem și cloudSegmentarea rețelei pentru tier-uri aplicațieLecția 5Gestionarea patch-urilor: ciclul de viață pachete OS, instrumente management configurare (Ansible, Puppet, Salt), ferestre programate și planuri rollbackPlanifică și operează gestionarea patch-urilor pentru sisteme de operare și aplicații. Învață ciclurile de viață ale pachetelor, folosind Ansible, Puppet sau Salt, programarea ferestrelor de mentenanță, testarea actualizărilor și pregătirea planurilor de rollback și comunicare.
Concepte ciclul de viață OS și pacheteFolosirea Ansible, Puppet sau SaltTestare patch-uri și medii stagingProgramarea ferestrelor de mentenanțăStrategii rollback și comunicareLecția 6Control acces și autentificare: management chei SSH, modele gazdă bastion, jumpbox-uri, plasare VPN, considerații MFAProiectează control acces securizat pentru servere folosind chei SSH, gazde bastion și VPN-uri. Învață managementul ciclului de viață al cheilor, modele jumpbox, integrarea MFA și jurnalizarea accesului administrativ pentru conformitate și răspuns la incidente.
Generarea și rotirea cheilor SSHModele gazde bastion și jumpboxPlasare VPN și fluxuri traficIntegrarea MFA pentru acces adminAudit și jurnalizare sesiuni remoteLecția 7Testare restaurare: exerciții recuperare, restaurare point-in-time pentru baze de date, concepte RTO/RPO și validare restaurăriÎnțelege cum să demonstrezi că backup-urile sunt utilizabile prin testare structurată de restaurare. Vei exersa exerciții de recuperare, restaurări point-in-time baze de date și pași de validare aliniați cu țintele RTO și RPO pentru servicii interne critice.
Definirea obiectivelor RTO și RPOPlanificarea și rularea exercițiilor recuperareTestare restaurări point-in-time baze de dateValidarea restaurărilor la nivel aplicațieDocumentarea și revizuirea rezultatelor testLecția 8Runbook-uri și playbooks operaționale: crearea și stocarea runbook-urilor, management schimbări, exemple runbook pentru sarcini comuneCreează runbook-uri și playbooks operaționale eficiente pentru sarcini de rutină și urgențe. Învață structura, stocarea și controlul schimbărilor, și revizuiește exemple concrete pentru implementări, reporniri, triaj incidente și pași rollback.
Structura runbook și detaliile necesareVersiuni și stocare runbook-uriManagement schimbări și aprobăriRunbook-uri pentru sarcini mentenanță comunePlaybooks răspuns incidente și escaladareLecția 9Arhitectură de bază monitorizare și alertare: metrici, loguri, trace-uri; alegerea unui stack de monitorizare (Prometheus, Grafana, Alertmanager, Nagios, Zabbix)Construiește o arhitectură de bază de monitorizare și alertare folosind metrici, loguri și trace-uri. Compară Prometheus, Grafana, Alertmanager, Nagios și Zabbix, și proiectează reguli de alertă, dashboard-uri și căi de escaladare pentru servicii interne.
Metrici cheie, loguri și semnale traceSelectarea unui stack de instrumente monitorizareProiectarea dashboard-urilor pentru operatoriReguli alertă, praguri și control zgomotPolitici escaladare și fluxuri on-callLecția 10Compromisuri înaltă disponibilitate și redundanță pentru o aplicație internă de mărime medie (balansare sarcină, sesiuni sticky, stocări sesiuni)Explorează modelele de înaltă disponibilitate și compromisurile de redundanță pentru o aplicație internă de mărime medie. Învață opțiuni de balansare sarcină, gestionarea sesiunilor sticky, stocări externe de sesiuni și scenarii de eșec pentru a echilibra costul, complexitatea și uptime-ul.
Identificarea cerințelor de disponibilitateTipuri balanșare sarcină și verificări sănătateSesiuni sticky versus design statelessStocări sesiuni externe și cacheModuri eșec și degradare grațioasă