Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a AIOps con Herramientas de Código Abierto
- Panorama general de los conceptos y beneficios de AIOps
- Prometheus y Grafana en la pila de observabilidad
- Dónde encaja el aprendizaje automático en AIOps: análisis predictivo vs. reactivo
Configuración de Prometheus y Grafana
- Instalación y configuración de Prometheus para la recopilación de series temporales
- Creación de paneles en Grafana usando métricas en tiempo real
- Exploración de exporters, reetiquetado y descubrimiento de servicios
Preprocesamiento de Datos para ML
- Extracción y transformación de métricas de Prometheus
- Preparación de conjuntos de datos para la detección de anomalías y previsión
- Uso de las transformaciones de Grafana o pipelines de Python
Aplicación de Aprendizaje Automático para la Detección de Anomalías
- Modelos básicos de ML para la detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM)
- Entrenamiento y evaluación de modelos en datos de series temporales
- Visualización de anomalías en paneles de Grafana
Previsión de Métricas con ML
- Construcción de modelos simples de previsión (ARIMA, Prophet, introducción a LSTM)
- Predicción de la carga del sistema o el uso de recursos
- Uso de las predicciones para alertas anticipadas y decisiones de escalado
Integración de ML con Alertas y Automatización
- Definición de reglas de alerta basadas en la salida de ML o umbrales
- Uso de Alertmanager y enrutamiento de notificaciones
- Disparo de scripts o flujos de trabajo automatizados ante la detección de anomalías
Escalado y Puesta en Producción de AIOps
- Integración de herramientas externas de observabilidad (por ejemplo, pila ELK, Moogsoft, Dynatrace)
- Puesta en producción de modelos de ML en pipelines de observabilidad
- Mejores prácticas para AIOps a gran escala
Resumen y Próximos Pasos
Requerimientos
- Comprensión de los conceptos de monitoreo de sistemas y observabilidad
- Experiencia usando Grafana o Prometheus
- Familiaridad con Python y principios básicos de aprendizaje automático
Público Objetivo
- Ingenieros de observabilidad
- Equipos de infraestructura y DevOps
- Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SRE)
14 Horas