Contacta con nosotros

Temario del curso

Revisión de los Conceptos Básicos de Apache Airflow

  • Conceptos centrales: DAGs, tareas y operadores.
  • Arquitectura y componentes de Airflow.
  • Repaso de casos de uso y flujos de trabajo comunes.

Optimización del Rendimiento del Flujo de Trabajo

  • Identificación de cuellos de botella en los pipelines de Airflow.
  • Técnicas de optimización a nivel de tarea.
  • Aprovechamiento de reintentos de tareas, paralelismo y concurrencia.

Gestión de Dependencias Complejas

  • Definición de dependencias dinámicas en flujos de trabajo.
  • Manejo de flujos de trabajo condicionales y con ramificaciones.
  • Uso efectivo de grupos de tareas y sub-DAGs.

Funcionalidades Avanzadas en Apache Airflow

  • Creación de operadores y hooks personalizados.
  • Implementación de sensores para disparadores externos.
  • Integración de servicios y plugins de terceros.

Escalado de las Implementaciones de Apache Airflow

  • Enfoques de escalado horizontal y vertical.
  • Uso de Celery Executors para ejecución distribuida.
  • Mejores prácticas para el escalado en entornos cloud.

Monitoreo y Depuración de Flujos de Trabajo

  • Configuración de registros (logging) y alertas para el monitoreo del flujo de trabajo.
  • Uso de la interfaz de usuario (UI) y la CLI de Airflow para la depuración.
  • Identificación y resolución de problemas comunes en las implementaciones de Airflow.

Seguridad de Apache Airflow

  • Autenticación y control de acceso en Airflow.
  • Protección de datos sensibles y configuraciones del entorno.
  • Implementación de registros de auditoría para los flujos de trabajo.

Usos Empresariales y Mejores Prácticas

  • Diseño de flujos de trabajo robustos para entornos de producción.
  • Aprovechamiento de Airflow para ingeniería de datos y pipelines ETL.
  • Exploración de estudios de casos del mundo real sobre implementaciones escalables de Airflow.

Resumen y Siguientes Pasos

Requerimientos

  • Conocimientos básicos de Apache Airflow.
  • Familiaridad con la programación en Python y conceptos de orquestación de flujos de trabajo.
  • Experiencia gestionando e implementando aplicaciones en entornos Linux.

Público Objetivo

  • Ingenieros de datos.
  • Profesionales de DevOps.
  • Desarrolladores de software.
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas