Contacta con nosotros

Temario del curso

Fundamentos de la Depuración y Evaluación en Mastra

  • Comprensión de los modelos de comportamiento del agente y los modos de fallo.
  • Principios básicos de depuración dentro de Mastra.
  • Evaluación de acciones deterministas y no deterministas de los agentes.

Configuración del Entorno para las Pruebas de Agentes

  • Configuración de entornos de prueba (sandboxes) y espacios de evaluación aislados.
  • Captura de registros, rastros y telemetría para un análisis detallado.
  • Preparación de conjuntos de datos y prompts para pruebas estructuradas.

Depuración del Comportamiento del Agente de IA

  • Rastreo de caminos de decisión y señales de razonamiento interno.
  • Identificación de alucinaciones, errores y comportamientos no deseados.
  • Uso de paneles de observabilidad para la investigación de la causa raíz.

Métricas de Evaluación y Marcos de Puntos de Referencia

  • Definición de métricas de evaluación cuantitativas y cualitativas.
  • Medición de la precisión, consistencia y cumplimiento contextual.
  • Aplicación de conjuntos de datos de referencia para una evaluación repetible.

Ingeniería de Fiabilidad para Agentes de IA

  • Diseño de pruebas de fiabilidad para agentes de ejecución prolongada.
  • Detección de deriva (drift) y degradación en el rendimiento del agente.
  • Implementación de salvaguardas para flujos de trabajo críticos.

Procesos de Aseguramiento de Calidad y Automatización

  • Construcción de canales de QA para la evaluación continua.
  • Automatización de pruebas de regresión para actualizaciones de los agentes.
  • Integración del QA con CI/CD y flujos de trabajo empresariales.

Técnicas Avanzadas para la Reducción de Alucinaciones

  • Estrategias de prompting para reducir salidas no deseadas.
  • Bucles de validación y mecanismos de autoverificación.
  • Experimentación con combinaciones de modelos para mejorar la fiabilidad.

Informes, Monitoreo y Mejora Continua

  • Desarrollo de informes de QA y hojas de puntuación (scorecards) del agente.
  • Monitoreo del comportamiento a largo plazo y los patrones de error.
  • Iteración en los marcos de evaluación para sistemas en evolución.

Resumen y Próximos Pasos

Requerimientos

  • Comprensión del comportamiento de los agentes de IA y las interacciones con los modelos.
  • Experiencia en la depuración o prueba de sistemas de software complejos.
  • Familiaridad con herramientas de observabilidad o registro (logging).

Público Objetivo

  • Ingenieros de aseguramiento de calidad (QA).
  • Ingenieros de fiabilidad de IA.
  • Desarrolladores responsables de la calidad y el rendimiento de los agentes.
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas