Temario del curso
Arquitectura de Greenplum
- Procesamiento en paralelo y procesamiento simétrico multiproceso (SMP)
- Roles de segmentos y configuración del clúster
- Escalabilidad y movimiento de datos
- Arquitectura de Greenplum Data Warehouse
Estructuras de Tablas en Greenplum
- Tablas distribuidas vs. tablas asignadas aleatoriamente
- Tablas heap vs. tablas de solo apéndice (append-only)
- Formatos de almacenamiento por filas y columnas (row vs. columnar)
- Tablas particionadas y agrupadas
Distribución de Datos y Hashing
- Lógica de hashing y claves de distribución
- Manejo del sesgo (skew) y su impacto en el rendimiento
- Mapas hash y estrategias de colocación de filas
Índices y Optimización del Rendimiento
- Índices agrupados y no agrupados (clustered vs. non-clustered)
- Casos de uso para índices B-tree y bitmap
- Escaneo de índices y comportamiento de almacenamiento
Diseño Físico de la Base de Datos
- Normalización y diseño del modelo lógico
- Estrategias de acceso de usuarios y análisis de distribución
- Demografía de datos y decisiones de indexación
Técnicas de Desnormalización
- Datos derivados, tablas resumen y preuniones (pre-joins)
- Tablas columnares como particionamiento vertical
- Data marts y vistas materializadas
SQL Avanzado y Ejecución de Consultas
- Estrategias de unión (join) y redistribución
- OLAP y funciones de ventana (window functions)
- Tablas temporales, subconsultas y tablas derivadas
Planes EXPLAIN y Ajuste de Consultas
- Lectura e interpretación de la salida EXPLAIN
- Análisis de costos y optimización del plan
- Movimiento de uniones y operaciones locales en segmentos (segment-local)
Utilidades y Mejores Prácticas de Greenplum
- ANALYZE y VACUUM
- Carga y movimiento de datos con Nexus
- Seguridad, permisos y consejos de rendimiento
Resumen y Próximos Pasos
Requerimientos
- Conocimiento de bases de datos relacionales y SQL
- Experiencia con sistemas de data warehousing o analíticos
- Familiaridad con operaciones en la línea de comandos de Linux
Público objetivo
- Arquitectos y ingenieros de datos
- Administradores de bases de datos y líderes técnicos
- Desarrolladores de BI y especialistas en análisis que trabajan con Greenplum
Testimonios (5)
los ejercicios y la resolucion de problemas
Mario Humberto Serrano Gutierrez - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
La teoria fue lo mas interesante
Luis Antonio Jimenez Gil - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
los ejercicios practicos y la disposicion para contestar las preguntas
Edith Vichua Solis - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
la explicacion, creo que uso terminos quee para todos fue demasiado entendible
Moises Jafet Hernandez Fuentes - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
las prácticas
Liliana Padilla - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
Traducción Automática