Temario del curso
Fundamentos de Operaciones en la Nube con AWS
- Roles y responsabilidades operativas en la nube
- Estructura de cuentas, organizaciones y estrategia multi-cuenta de AWS
- Servicios operativos principales: CloudWatch, CloudTrail, AWS Config
Infraestructura como Código y Aprovisionamiento
- Principios de IaC (Infraestructura como Código) e infraestructura inmutable
- Aprovisionamiento con Terraform y AWS CloudFormation
- Gestión de estado, módulos y promoción de entornos
CI/CD y Estrategias de Implementación
- Diseño de pipelines CI/CD para aplicaciones nativas en la nube
- Implementaciones azul/verde, canarias y rolling
- Automatización de rollback, verificaciones de salud y validación de lanzamientos
Monitoreo, Observabilidad y Alertas
- Métricas, registros y trazas: envío, almacenamiento y análisis
- Uso de CloudWatch, X-Ray y herramientas de observabilidad de terceros
- Definición de SLOs/SLLIs, políticas de alerta y prácticas de guardia activa (on-call)
Operaciones de Seguridad y Gestión de Identidad
- Mejores prácticas de IAM, privilegios mínimos y acceso entre cuentas
- Administración de secretos, KMS y almacenes de parámetros seguros
- Seguridad operativa: estrategias de parcheo, escaneo de vulnerabilidades y rastros de auditoría
Resiliencia, Copia de Seguridad y Recuperación ante Desastres
- Diseño para tolerancia a fallas y alta disponibilidad
- Estrategias de copia de seguridad, automatización de instantáneas y procedimientos de restauración
- Planificación de recuperación ante desastres y creación de runbooks
Optimización de Costos y Gobierno
- Visibilidad de costos: facturación, etiquetado y estrategias de asignación de costos
- Dimensionamiento correcto, instancias reservadas/planes de ahorro y controles de presupuesto
- Gobierno: políticas, barreras de seguridad (guardrails) y automatización para cumplimiento
Contenedores, Servicios Sin Servidor y Operaciones en Tiempo de Ejecución
- Consideraciones operativas para ECS, EKS y Lambda
- Descubrimiento de servicios, escalado automático y límites de recursos
- Registro, trazado y depuración de cargas de trabajo contenerizadas
Respuesta a Incidentes, Playbooks y Ingeniería del Caos
- Respuesta a incidentes basada en runbooks y prácticas de post-mortem
- Automatización de la mitigación y patrones de auto-correctiva
- Introducción a experimentos de caos para validar resiliencia
Taller Práctico: Operar una Carga de Trabajo de Ejemplo
- Desplegar una aplicación de ejemplo utilizando IaC y un pipeline CI/CD
- Implementar monitoreo, alertas y un script de remediación automatizado
- Simular incidentes y practicar respuestas basadas en runbooks
Resumen y Próximos Pasos
Requerimientos
- Conocimientos básicos de conceptos de nube y redes
- Familiaridad con la línea de comandos de Linux y scripting
- Experiencia con control de versiones (Git) y conceptos básicos de CI/CD
Audiencia
- Ingenieros de operaciones en la nube
- SREs y ingenieros de plataforma
- Ingenieros DevOps y líderes técnicos de equipos
Testimonios (5)
El entrenador tenía una buena comprensión de los conceptos
Josheel - Verizon Connect
Curso - Amazon Redshift
Traducción Automática
La parte práctica.
Radu - Ness Digital Engineering
Curso - AWS: A Hands-on Introduction to Cloud Computing
Traducción Automática
El entrenador sabía exactamente de qué estaba hablando.
Madumetsa Msomi - BMW
Curso - AWS DevOps Engineers
Traducción Automática
Todo bien, nada que mejorar
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Curso - AWS Lambda for Developers
Traducción Automática
Aplicaciones de IoT
Palaniswamy Suresh Kumar - Makers' Academy
Curso - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Traducción Automática