Contacta con nosotros

Temario del curso

Introducción a AIOps con Herramientas de Código Abierto

  • Panorama general de los conceptos y beneficios de AIOps
  • Prometheus y Grafana en la pila de observabilidad
  • Dónde encaja el aprendizaje automático en AIOps: análisis predictivo vs. reactivo

Configuración de Prometheus y Grafana

  • Instalación y configuración de Prometheus para la recopilación de series temporales
  • Creación de paneles en Grafana usando métricas en tiempo real
  • Exploración de exporters, reetiquetado y descubrimiento de servicios

Preprocesamiento de Datos para ML

  • Extracción y transformación de métricas de Prometheus
  • Preparación de conjuntos de datos para la detección de anomalías y previsión
  • Uso de las transformaciones de Grafana o pipelines de Python

Aplicación de Aprendizaje Automático para la Detección de Anomalías

  • Modelos básicos de ML para la detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM)
  • Entrenamiento y evaluación de modelos en datos de series temporales
  • Visualización de anomalías en paneles de Grafana

Previsión de Métricas con ML

  • Construcción de modelos simples de previsión (ARIMA, Prophet, introducción a LSTM)
  • Predicción de la carga del sistema o el uso de recursos
  • Uso de las predicciones para alertas anticipadas y decisiones de escalado

Integración de ML con Alertas y Automatización

  • Definición de reglas de alerta basadas en la salida de ML o umbrales
  • Uso de Alertmanager y enrutamiento de notificaciones
  • Disparo de scripts o flujos de trabajo automatizados ante la detección de anomalías

Escalado y Puesta en Producción de AIOps

  • Integración de herramientas externas de observabilidad (por ejemplo, pila ELK, Moogsoft, Dynatrace)
  • Puesta en producción de modelos de ML en pipelines de observabilidad
  • Mejores prácticas para AIOps a gran escala

Resumen y Próximos Pasos

Requerimientos

  • Comprensión de los conceptos de monitoreo de sistemas y observabilidad
  • Experiencia usando Grafana o Prometheus
  • Familiaridad con Python y principios básicos de aprendizaje automático

Público Objetivo

  • Ingenieros de observabilidad
  • Equipos de infraestructura y DevOps
  • Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SRE)
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas