Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo

  • ¿Qué es el aprendizaje por refuerzo?
  • Conceptos clave: agente, entorno, estados, acciones y recompensas
  • Desafíos en el aprendizaje por refuerzo

Exploración y Explotación

  • Equilibrar la exploración y la explotación en los modelos de RL
  • Estrategias de exploración: epsilon-greedy, softmax y más

Q-Learning y Redes Neuronales de Q Profundo (DQNs)

  • Introducción al Q-learning
  • Implementación de DQNs utilizando TensorFlow
  • Optimización del Q-learning con memoria de experiencia y redes objetivo

Métodos Basados en Políticas

  • Algoritmos de gradiente de política
  • Algoritmo REINFORCE y su implementación
  • Métodos actor-crítico

Trabajando con OpenAI Gym

  • Configuración de entornos en OpenAI Gym
  • Simulación de agentes en entornos dinámicos
  • Evaluación del rendimiento del agente

Técnicas Avanzadas de Aprendizaje por Refuerzo

  • Aprendizaje por refuerzo multiagente
  • Gradiente de política determinista profunda (DDPG)
  • Optimización de política proximal (PPO)

Despliegue de Modelos de Aprendizaje por Refuerzo

  • Aplicaciones del mundo real del aprendizaje por refuerzo
  • Integración de modelos RL en entornos de producción

Resumen y Próximos Pasos

Requerimientos

  • Experiencia con programación en Python
  • Comprensión básica de los conceptos de aprendizaje profundo y aprendizaje automático
  • Conocimiento de algoritmos y conceptos matemáticos utilizados en el aprendizaje por refuerzo

Público Objetivo

  • Científicos de datos
  • Profesionales de aprendizaje automático
  • Investigadores de IA
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas