Contacta con nosotros

Temario del curso

Introducción al ajuste fino de DeepSeek LLM

  • Descripción general de los modelos DeepSeek, por ejemplo, DeepSeek-R1 y DeepSeek-V3.
  • Comprensión de la necesidad de realizar ajuste fino en LLM.
  • Comparación entre el ajuste fino y la ingeniería de prompts (prompt engineering).

Preparación del conjunto de datos para el ajuste fino

  • Selección y curación de conjuntos de datos específicos del dominio.
  • Técnicas de preprocesamiento y limpieza de datos.
  • Tokenización y formato del conjunto de datos para DeepSeek LLM.

Configuración del entorno de ajuste fino

  • Configuración de la aceleración con GPU y TPU.
  • Instalación y configuración de Hugging Face Transformers con DeepSeek LLM.
  • Comprensión de los hiperparámetros para el ajuste fino.

Realización del ajuste fino de DeepSeek LLM

  • Implementación del ajuste fino supervisado.
  • Uso de LoRA (Adaptación de Bajo Rango) y PEFT (Ajuste Fino Eficiente en Parámetros).
  • Ejecución del ajuste fino distribuido para conjuntos de datos a gran escala.

Evaluación y optimización de modelos ajustados

  • Evaluación del rendimiento del modelo mediante métricas de evaluación.
  • Manejo del sobreajuste (overfitting) y el subajuste (underfitting).
  • Optimización de la velocidad de inferencia y la eficiencia del modelo.

Implementación de modelos DeepSeek ajustados

  • Empaquetado de modelos para su implementación vía API.
  • Integración de modelos ajustados en aplicaciones existentes.
  • Escalado de implementaciones mediante computación en la nube y en el borde (edge computing).

Casos de uso reales y aplicaciones

  • LLM ajustados para finanzas, salud y atención al cliente.
  • Estudios de caso sobre aplicaciones industriales.
  • Consideraciones éticas en modelos de IA específicos del dominio.

Resumen y próximos pasos

Requerimientos

  • Experiencia con marcos de aprendizaje automático y aprendizaje profundo.
  • Familiaridad con transformadores y modelos de lenguaje grandes (LLM).
  • Comprensión de técnicas de preprocesamiento de datos y entrenamiento de modelos.

Público objetivo

  • Investigadores de IA que exploran el ajuste fino de LLM.
  • Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados.
  • Desarrolladores avanzados que implementan soluciones impulsadas por IA.
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas