Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción
- Comprender la importancia de la preparación de datos en análisis y machine learning
- Pipeline de preparación de datos y su papel en el ciclo de vida de los datos
- Explorar desafíos comunes en datos brutos y su impacto en el análisis
Recopilación y adquisición de datos
- Fuentes de datos: bases de datos, APIs, hojas de cálculo, archivos de texto y más
- Técnicas para recolectar datos y garantizar la calidad durante la recopilación
- Recolección de datos de diversas fuentes
Data Cleaning Técnicas
- Identificar y manejar valores faltantes, outliers e inconsistencias
- Lidiar con duplicados y errores en el conjunto de datos
- Limpieza de conjuntos de datos del mundo real
Transformación y estandarización de datos
- Técnicas de normalización y estandarización de datos
- Manejo de datos categóricos: codificación, agrupamiento y ingeniería de características
- Transformación de datos brutos en formatos útiles
Data Integration y Agregación
- Combinar y unir conjuntos de datos de diferentes fuentes
- Resolver conflictos de datos y alinear tipos de datos
- Técnicas para la agregación y consolidación de datos
Data Quality Seguros
- Métodos para garantizar la calidad e integridad de los datos durante todo el proceso
- Implementar controles de calidad y procedimientos de validación
- Casos prácticos y aplicaciones de aseguramiento de calidad de datos
Reducción de dimensionalidad y selección de características
- Comprender la necesidad de reducción de dimensionalidad
- Técnicas como PCA, selección de características y estrategias de reducción
- Implementar técnicas de reducción de dimensionalidad
Resumen y próximos pasos
Requerimientos
- Comprensión básica de conceptos de datos
Audiencia
- Analistas de datos
- Database administradores
- Profesionales de TI
14 Horas
Testimonios (2)
Es una sesión práctica.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curso - Talend Open Studio for ESB
Traducción Automática
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Curso - GDPR Workshop
Traducción Automática