Programa del Curso

Introducción a la IA Multimodal

  • Visión general de la IA multimodal y sus aplicaciones reales
  • Desafíos en la integración de datos de texto, imagen y audio
  • Investigación e innovaciones de vanguardia

Procesamiento de Datos y Ingeniería de Características

  • Manejo de conjuntos de datos de texto, imagen y audio
  • Técnicas de preprocesamiento para el aprendizaje multimodal
  • Extracción de características y estrategias de fusión de datos

Creación de Modelos Multimodales con PyTorch y Hugging Face

  • Introducción a PyTorch para el aprendizaje multimodal
  • Uso de Hugging Face Transformers para tareas de NLP y visión
  • Combinación de diferentes modalidades en un modelo AI unificado

Implementación de Fusión de Voz, Visión y Texto

  • Integración de OpenAI Whisper para reconocimiento de voz
  • Aplicación de DeepSeek-Vision para procesamiento de imágenes
  • Técnicas de fusión para el aprendizaje intermodal

Entrenamiento y Optimización de Modelos AI Multimodales

  • Estrategias de entrenamiento del modelo para IA multimodal
  • Técnicas de optimización y ajuste de hiperparámetros
  • Manejo de sesgos e mejora de la generalización del modelo

Implementación de IA Multimodal en Aplicaciones Reales

  • Exportación de modelos para uso en producción
  • Implementación de modelos AI en plataformas en la nube
  • Monitoreo del rendimiento y mantenimiento del modelo

Temas Avanzados y Tendencias Futuras

  • Aprendizaje zero-shot y few-shot en IA multimodal
  • Consideraciones éticas y desarrollo responsable de AI
  • Tendencias emergentes en la investigación de IA multimodal

Resumen y Próximos Pasos

Requerimientos

  • Comprensión sólida de los conceptos de aprendizaje automático y aprendizaje profundo
  • Experiencia con frameworks de IA como PyTorch o TensorFlow
  • Familiaridad con el procesamiento de datos de texto, imágenes y audio

Áudito

  • Desarrolladores de IA
  • Ingenieros de aprendizaje automático
  • Investigadores
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas