Contacta con nosotros

Temario del curso

Introducción

Esta sección proporciona una introducción general sobre cuándo utilizar el 'aprendizaje automático', qué aspectos deben considerarse y qué implica todo ello, incluidos los pros y los contras. Tipos de datos (estructurados/no estructurados, estáticos/flujo continuo), validez y volumen de los datos, análisis impulsado por datos frente a impulsado por usuarios, modelos estadísticos frente a modelos de aprendizaje automático, desafíos del aprendizaje no supervisado, el equilibrio entre sesgo y varianza, iteración/evaluación, enfoques de validación cruzada, aprendizaje supervisado/no supervisado/reforzado.

TEMAS PRINCIPALES

1. Comprender Naive Bayes

  • Conceptos básicos de los métodos bayesianos
  • Probabilidad
  • Probabilidad conjunta
  • Probabilidad condicional con el teorema de Bayes
  • El algoritmo Naive Bayes
  • La clasificación de Naive Bayes
  • El estimador de Laplace
  • Uso de características numéricas con Naive Bayes

2. Comprender los árboles de decisión

  • Dividir y conquistar
  • El algoritmo de árbol de decisión C5.0
  • Elegir la mejor división
  • Poda del árbol de decisión

3. Comprender las redes neuronales

  • Desde las neuronas biológicas hasta las artificiales
  • Funciones de activación
  • Topología de la red
  • El número de capas
  • La dirección del flujo de información
  • El número de nodos en cada capa
  • Entrenamiento de redes neuronales mediante retropropagación
  • Aprendizaje profundo

4. Comprender las Máquinas de Soporte Vectorial (SVM)

  • Clasificación con hiperplanos
  • Búsqueda del margen máximo
  • El caso de datos linealmente separables
  • El caso de datos no linealmente separables
  • Uso de núcleos para espacios no lineales

5. Comprender el agrupamiento (clustering)

  • El agrupamiento como tarea de aprendizaje automático
  • El algoritmo k-means para agrupamiento
  • Uso de la distancia para asignar y actualizar clústeres
  • Elegir el número adecuado de clústeres

6. Medir el rendimiento para la clasificación

  • Trabajo con datos de predicción de clasificación
  • Un análisis más detallado de las matrices de confusión
  • Uso de matrices de confusión para medir el rendimiento
  • Más allá de la precisión: otras medidas de rendimiento
  • La estadística kappa
  • Sensibilidad y especificidad
  • Precisión y recuperación (recall)
  • La medida F (F-measure)
  • Visualización de compensaciones en el rendimiento
  • Curvas ROC
  • Estimación del rendimiento futuro
  • El método de separación (holdout)
  • Validación cruzada
  • Muestreo bootstrap

7. Ajustar modelos estándar para mejorar el rendimiento

  • Uso de caret para la ajuste automático de parámetros
  • Creación de un modelo ajustado sencillo
  • Personalización del proceso de ajuste
  • Mejora del rendimiento del modelo mediante metaprendizaje
  • Comprensión de los conjuntos de modelos (ensembles)
  • Agrupamiento por bolsas (Bagging)
  • Elevación (Boosting)
  • Bosques aleatorios (Random Forests)
  • Entrenamiento de bosques aleatorios
  • Evaluación del rendimiento de los bosques aleatorios

TEMAS SECUNDARIOS

8. Comprender la clasificación mediante vecinos más cercanos

  • El algoritmo kNN
  • Cálculo de la distancia
  • Elegir un valor adecuado de k
  • Preparación de datos para su uso con kNN
  • ¿Por qué el algoritmo kNN es perezoso?

9. Comprender las reglas de clasificación

  • Separar y conquistar
  • El algoritmo One Rule
  • El algoritmo RIPPER
  • Reglas derivadas de árboles de decisión

10. Comprender la regresión

  • Regresión lineal simple
  • Estimación por mínimos cuadrados ordinarios
  • Correlaciones
  • Regresión lineal múltiple

11. Comprender los árboles de regresión y los árboles de modelo

  • Añadiendo regresión a los árboles

12. Comprender las reglas de asociación

  • El algoritmo Apriori para el aprendizaje de reglas de asociación
  • Medición del interés de la regla: soporte y confianza
  • Construcción de un conjunto de reglas con el principio de Apriori

Contenido adicional

  • Spark/PySpark/MLlib y los banditos multi-brazo (Multi-armed bandits)

Requerimientos

Conocimientos de Python

 21 Horas

Número de participantes


Precio por participante

Testimonios (7)

Próximos cursos

Categorías Relacionadas