Programa del Curso

Introducción

  • Comprender la importancia de la preparación de datos en análisis y machine learning
  • Pipeline de preparación de datos y su papel en el ciclo de vida de los datos
  • Explorar desafíos comunes en datos brutos y su impacto en el análisis

Recopilación y adquisición de datos

  • Fuentes de datos: bases de datos, APIs, hojas de cálculo, archivos de texto y más
  • Técnicas para recolectar datos y garantizar la calidad durante la recopilación
  • Recolección de datos de diversas fuentes

Data Cleaning Técnicas

  • Identificar y manejar valores faltantes, outliers e inconsistencias
  • Lidiar con duplicados y errores en el conjunto de datos
  • Limpieza de conjuntos de datos del mundo real

Transformación y estandarización de datos

  • Técnicas de normalización y estandarización de datos
  • Manejo de datos categóricos: codificación, agrupamiento y ingeniería de características
  • Transformación de datos brutos en formatos útiles

Data Integration y Agregación

  • Combinar y unir conjuntos de datos de diferentes fuentes
  • Resolver conflictos de datos y alinear tipos de datos
  • Técnicas para la agregación y consolidación de datos

Data Quality Seguros

  • Métodos para garantizar la calidad e integridad de los datos durante todo el proceso
  • Implementar controles de calidad y procedimientos de validación
  • Casos prácticos y aplicaciones de aseguramiento de calidad de datos

Reducción de dimensionalidad y selección de características

  • Comprender la necesidad de reducción de dimensionalidad
  • Técnicas como PCA, selección de características y estrategias de reducción
  • Implementar técnicas de reducción de dimensionalidad

Resumen y próximos pasos

Requerimientos

  • Comprensión básica de conceptos de datos

Audiencia

  • Analistas de datos
  • Database administradores
  • Profesionales de TI
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (2)

Próximos cursos

Categorías Relacionadas