Lección 1Interpretación de logs para apps web y servicios del sistema: /var/log/syslog, /var/log/messages, journald (journalctl), logs específicos de aplicaciones y cómo filtrarlosAprende a leer y filtrar logs de Linux y macOS para apps web y servicios. Trabajarás con syslog, journald y logs de aplicaciones, usando journalctl, grep y otras herramientas para aislar problemas, correlacionar eventos y crear consultas de logs repetibles.
Estructura de syslog y ubicaciones comunes de logsUso de filtros y rangos de tiempo en journalctlLectura de logs de acceso y error de servidores webFiltrado de logs con grep, awk y sedCorrelación de eventos multi-servicio por timestampLección 2Identificación y análisis de procesos: ps aux, pstree, pmap, lsof, strace — encontrar el proceso problemático e inspeccionar su comportamientoDesarrolla técnicas para encontrar e inspeccionar procesos problemáticos. Usando ps, pstree, pmap, lsof y strace, mapearás jerarquías de procesos, examinarás archivos y puertos abiertos, rastrearás llamadas al sistema y vincularás picos de recursos a PIDs específicos.
Localizar procesos pesados con ps y topVisualizar padres e hijos con pstreeInspeccionar mapas de memoria usando pmapEncontrar archivos y puertos abiertos con lsofRastrear llamadas al sistema y cuelgues con straceLección 3Diagnóstico de red en Linux: ss, netstat, ip a, ip route, ethtool, ifconfig — cómo leer información de interfaces y rutasAdquiere habilidades para diagnosticar problemas de red en Linux y macOS. Usarás ss, netstat, ip, ifconfig y ethtool para inspeccionar sockets, rutas e interfaces, identificar servicios escuchando y verificar problemas de conectividad y rendimiento.
Listar puertos escuchando con ss y netstatInspeccionar direcciones IP y rutas con ipVerificar velocidad de enlace y dúplex con ethtoolUsar ifconfig e ip para estado de interfacesDetectar problemas comunes de ruteo y DNSLección 4Investigación de I/O de disco: iostat, iotop, blktrace, verificación de tipos de filesystem y opciones de montajeInvestiga cuellos de botella de I/O de disco y comportamiento de filesystem. Usarás iostat, iotop y blktrace, inspeccionarás tipos de filesystem y opciones de montaje, y relacionarás patrones de I/O con cargas de trabajo de aplicaciones y síntomas de latencia.
Detectar saturación de I/O con iostatEncontrar procesos intensivos en I/O usando iotopRastrear actividad a nivel de bloques con blktraceComparar tipos de filesystem y sus trade-offsRevisar opciones de montaje para rendimientoLección 5Comandos para monitoreo en vivo: top, htop, vmstat, iostat, sar, mpstat — ejemplos exactos de uso e interpretaciónExplora herramientas de monitoreo en vivo para entender el comportamiento del sistema en tiempo real. Usarás top, htop, vmstat, iostat, sar y mpstat para detectar cuellos de botella de CPU, memoria e I/O, interpretar campos clave y capturar instantáneas cortas de rendimiento.
Leer CPU y carga en top y htopUsar vmstat para insights de memoria y swapMonitorear I/O de disco con iostat y iotopInstantáneas históricas con sar y mpstatExportar salida de comandos para revisión posteriorLección 6Análisis de rendimiento de servidores web: módulos de estado nginx/apache, logs de acceso/error, análisis de requests lentos, patrones de estado HTTPAprende a evaluar el rendimiento de servidores web en nginx y Apache. Leerás módulos de estado, analizarás logs de acceso y error, detectarás requests lentos e interpretarás patrones de estado HTTP para distinguir problemas de clientes de cuellos de botella del servidor.
Habilitar y leer endpoints de estado de nginxUsar Apache mod_status y server-statusIdentificar requests lentos y timeoutsAnalizar distribuciones de códigos de estado HTTPDetectar bots, escaneos y tráfico abusivoLección 7Remediación a largo plazo: planificación de capacidad, límites de recursos (systemd, cgroups), ajuste de configs de kernel y servidor web, herramientas de profiling de aplicaciones y cuándo usarlasPlanifica soluciones a largo plazo en lugar de apagar incendios repetidos. Practicarás planificación de capacidad, establecerás límites de recursos con systemd y cgroups, ajustarás parámetros de kernel y servidor web, y elegirás herramientas de profiling para guiar cambios de código y configuración.
Recolectar datos para planificación de capacidadConfigurar límites de recursos de unidades systemdAplicar restricciones básicas de cgroup de forma seguraAjustar parámetros de kernel y servidor webSeleccionar y usar herramientas de profiling de appsLección 8Entendiendo métricas de recursos del sistema: CPU, memoria, I/O, red — qué monitorear y por quéEntiende las métricas principales del sistema y qué revelan sobre la salud. Interpretarás indicadores de CPU, memoria, disco y red, aprenderás umbrales seguros y decidirás qué métricas importan más para cargas web y servicios en background.
Utilización de CPU, promedio de carga y colas de ejecuciónUso de memoria, caché y comportamiento de swapRendimiento de disco, latencia y profundidad de colaAncho de banda de red, errores y caídasElegir umbrales de alerta para métricas claveLección 9Técnicas de mitigación temporal: reiniciar servicios, ajustar niceness de procesos, liberar cachés, sacar servicios offline graciosamente — comandos y resultados esperadosAplica mitigaciones temporales seguras durante incidentes. Reiniciarás servicios, ajustarás niceness, manejarás cachés y sacarás servicios offline graciosamente, entendiendo comandos, riesgos y cómo verificar que las mitigaciones son efectivas.
Reiniciar servicios críticos de forma seguraAjustar prioridad de procesos con nice y reniceLiberar caché de páginas y dentries cuidadosamentePoner apps web en modo mantenimientoVerificar impacto de mitigación en métricas