Contacta con nosotros

Temario del curso

Preparación de modelos de aprendizaje automático para su despliegue

  • Embalaje de modelos con Docker
  • Exportación de modelos desde TensorFlow y PyTorch
  • Consideraciones sobre versionado y almacenamiento

Servicio de modelos en Kubernetes

  • Visión general de servidores de inferencia
  • Despliegue de TensorFlow Serving y TorchServe
  • Configuración de puntos de conexión de modelos

Técnicas de optimización de la inferencia

  • Estrategias de agrupamiento (batching)
  • Gestión de solicitudes concurrentes
  • Ajuste de latencia y rendimiento

Escalado automático de cargas de trabajo de ML

  • Horizontal Pod Autoscaler (HPA)
  • Vertical Pod Autoscaler (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

Provisión de GPU y gestión de recursos

  • Configuración de nodos con GPU
  • Visión general del plugin de dispositivos NVIDIA
  • Solicitudes y límites de recursos para cargas de trabajo de ML

Estrategias de lanzamiento y liberación de modelos

  • Despliegues azul/verde
  • Patrones de despliegue canario
  • Pruebas A/B para la evaluación de modelos

Monitoreo y observabilidad de ML en producción

  • Métricas para cargas de trabajo de inferencia
  • Prácticas de registro (logging) y trazabilidad
  • Paneles de control y alertas

Consideraciones de seguridad y confiabilidad

  • Seguridad de los puntos de conexión de modelos
  • Políticas de red y control de acceso
  • Aseguramiento de alta disponibilidad

Resumen y próximos pasos

Requerimientos

  • Comprensión del flujo de trabajo de aplicaciones contenerizadas
  • Experiencia con modelos de aprendizaje automático basados en Python
  • Familiaridad con los fundamentos de Kubernetes

Público objetivo

  • Ingenieros de ML
  • Ingenieros DevOps
  • Equipos de ingeniería de plataformas
 14 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas