Curso de Bóveda de Datos: Creación de un Almacén de Datos Escalable
Data Vault El modelado es una técnica de modelado de bases de datos que proporciona almacenamiento histórico a largo plazo de datos que se originan en múltiples fuentes. Una bóveda de datos almacena una única versión de los hechos, o "todos los datos, todo el tiempo". Su diseño flexible, escalable, consistente y adaptable abarca los mejores aspectos de la 3ª forma normal (3NF) y el esquema de estrella.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo construir un Data Vault.
Al final de esta formación, los participantes serán capaces de:
- Comprender los conceptos de arquitectura y diseño detrás de Data Vault 2.0 y su interacción con Big Data, NoSQL e IA.
- Utilice técnicas de almacenamiento de datos para permitir la auditoría, el seguimiento y la inspección de datos históricos en un almacén de datos.
- Desarrolle un proceso ETL (Extracción, Transformación, Carga) coherente y repetible.
- Construya e implemente almacenes altamente escalables y repetibles.
Formato del curso
- En parte conferencia, en parte discusión, ejercicios y práctica práctica intensa
Programa del Curso
Introducción
- Las deficiencias de las arquitecturas de modelado de datos de almacenamiento de datos existentes
- Beneficios del modelado Data Vault
Visión general de Data Vault los principios de arquitectura y diseño
- SEI / CMM / Cumplimiento
Data Vault Aplicaciones
- Almacenamiento dinámico de datos
- Almacenamiento de exploración
- En-Database Data Mining
- Vinculación rápida de información externa
Data Vault Componentes
- Hubs, enlaces, satélites
Construcción de un Data Vault
Modelado de Hubs, Enlaces y Satélites
Data Vault Reglas de referencia
Cómo interactúan los componentes entre sí
Modelado y relleno de un Data Vault
Conversión de OLTP 3NF en una Data Vault empresa Data Warehouse (EDW)
Descripción de las fechas de carga, las fechas de finalización y las operaciones de unión
Business Claves, relaciones, tablas de enlaces y técnicas de unión
Técnicas de consulta
Procesamiento de carga y procesamiento de consultas
Descripción general de Matrix Metodología
Obtención de datos en entidades de datos
Entidades de Loading Hub
Entidades de enlace de carga
Cargando satélites
Uso de plantillas SEI/CMM Nivel 5 para obtener resultados repetibles, fiables y cuantificables
Desarrollo de un proceso ETL (Extracción, Transformación, Carga) consistente y repetible
Creación e implementación de almacenes altamente escalables y repetibles
Palabras de clausura
Requerimientos
- Comprensión de los conceptos de almacenamiento de datos
- Comprensión de los conceptos de bases de datos y modelado de datos
Audiencia
- Modeladores de datos
- Especialista en almacenamiento de datos
- Business Especialistas en inteligencia
- Ingenieros de datos
- Database Administradores
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Bóveda de Datos: Creación de un Almacén de Datos Escalable - Booking
Curso de Bóveda de Datos: Creación de un Almacén de Datos Escalable - Enquiry
Bóveda de Datos: Creación de un Almacén de Datos Escalable - Consultas
Consultas
Testimonios (1)
cómo el instructor demuestra su conocimiento sobre la materia que enseña
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Curso - Data Vault: Building a Scalable Data Warehouse
Traducción Automática
Próximos cursos
Cursos Relacionados
De los Datos a la Decisión con Big Data y Análisis Predictivo
21 HorasAudiencia
Si intentas dar sentido a los datos a los que tienes acceso o quieres analizar datos no estructurados disponibles en la red (como Twitter, Linked in, etc...) este curso es para ti.
Está dirigido principalmente a los responsables de la toma de decisiones y a las personas que necesitan elegir qué datos vale la pena recopilar y cuáles vale la pena analizar.
No está dirigido a las personas que configuran la solución, sin embargo, esas personas se beneficiarán del panorama general.
Modo de entrega
Durante el curso, se presentarán a los delegados ejemplos de trabajo de tecnologías de código abierto.
A las conferencias breves les seguirán una presentación y ejercicios sencillos por parte de los participantes
Contenido y software utilizado
Todo el software utilizado se actualiza cada vez que se ejecuta el curso, por lo que comprobamos las versiones más recientes posibles.
Abarca el proceso desde la obtención, formateo, procesamiento y análisis de los datos, hasta explicar cómo automatizar el proceso de toma de decisiones con machine learning.
Minería y Análisis de Datos
28 HorasObjetivo:
Los delegados serán capaces de analizar grandes conjuntos de datos, extraer patrones, elegir la variable correcta que impacte los resultados para que un nuevo modelo se pronostique con resultados predictivos.
Minería de Datos
21 HorasEl curso se puede proporcionar con cualquier herramienta, incluido el software y las aplicaciones gratuitas de minería de datos de código abierto
Data Mining with Python
14 Horaseste entrenamiento en vivo (in situ o remoto) dirigido por un instructor está dirigido a analistas de datos y científicos de datos que deseen implementar técnicas de análisis de datos más avanzadas para la minería de datos mediante python.
al final de esta formación, los participantes podrán:
- Comprender áreas importantes de la minería de datos, incluyendo la minería de reglas de asociación, el análisis de sentimientos en texto, la síntesis automática de texto y la detección de anomalías en datos.
- Comparar e implementar diversas estrategias para resolver problemas de minería de datos del mundo real.
- Comprender e interpretar los resultados.
Format del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y prácticas.
- Implementación práctica en un entorno de laboratorio en vivo.
Course
- Para solicitar una formación personalizada para este curso, por favor contáctenos para organizarlo.
Minería de Datos con R
14 HorasR es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número cada vez mayor de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R tiene una amplia variedad de paquetes para la minería de datos.
Visualización de Datos
28 HorasEste curso está dirigido a ingenieros y tomadores de decisiones que trabajan en minería de datos y descubrimiento de conocimientos.
Aprenderá cómo crear diagramas efectivos y formas de presentar y representar sus datos de una manera que atraiga a los tomadores de decisiones y les ayude a comprender la información oculta.
Minería de Datos y Aprendizaje Automático con R
14 HorasR es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número cada vez mayor de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R tiene una amplia variedad de paquetes para la minería de datos.
Ciencia de Datos para Big Data Analytics
35 HorasBig data son conjuntos de datos que son tan voluminosos y complejos que el software de aplicación de procesamiento de datos tradicional es inadecuado para manejarlos. Los grandes desafíos de datos incluyen la captura de datos, el almacenamiento de datos, el análisis de datos, la búsqueda, el intercambio, la transferencia, la visualización, la consulta, la actualización y la privacidad de la información.
Fundación R
7 HorasEsta formación en vivo dirigida por un instructor en Venezuela (en línea o presencial) está destinada a profesionales principiantes que desean dominar los fundamentos de R y cómo trabajar con datos.
Al finalizar esta formación, los participantes podrán:
- Comprender el entorno de programación R e la interfaz de RStudio.
- Importar, manipular y explorar conjuntos de datos utilizando comandos y paquetes de R.
- Ejecutar análisis estadísticos básicos y resumir datos.
- Generar visualizaciones usando tanto R base como ggplot2.
- Gestionar espacios de trabajo, scripts y paquetes de manera efectiva.
KNIME Analytics Platform for BI
21 HorasKNIME Analytics Platform es una opción líder de código abierto para la innovación basada en datos, que le ayuda a descubrir el potencial oculto en sus datos, extraer información fresca o predecir nuevos futuros. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la más amplia selección de algoritmos avanzados disponibles, KNIME Analytics Platform es la caja de herramientas perfecta para cualquier científico de datos y analista de negocios.
Este curso para KNIME Analytics Platform es una oportunidad ideal para que los principiantes, los usuarios avanzados y los KNIME expertos conozcan KNIME, aprendan a utilizarlo de forma más eficaz y a crear informes claros y completos basados en KNIME flujos de trabajo
Platforma analityczna KNIME - szkolenie kompleksowe
35 HorasEl curso de formación "Analytics Platform KNIME" ofrece una visión completa de esta plataforma gratuita de análisis de datos. El programa incluye una introducción al procesamiento y análisis de datos, instalación y configuración KNIME, creación de flujos de trabajo, metodología para la creación de modelos de negocio y modelado de datos. El curso también analiza herramientas avanzadas de análisis de datos, importación y exportación de flujos de trabajo, integración de herramientas, procesos ETL, minería de datos, visualización, extensiones e integraciones con herramientas como R, Java, Python, Gephi, Neo4j. La conclusión incluye una visión general de la presentación de informes, la integración con BIRT y KNIME WebPortal.
Oracle SQL Intermedio - Extracción de Datos
14 HorasEl objetivo del curso es permitir que los participantes adquieran un dominio de cómo trabajar con el lenguaje SQL en la base de datos Oracle para la extracción de datos a un nivel intermedio.
Minería de Procesos
21 HorasProcess mining o Automated Business Process Discovery (ABPD) es una técnica que aplica algoritmos a los registros de eventos con el fin de analizar procesos comerciales. La minería de procesos va más allá del almacenamiento de datos y el análisis de datos; enlaza los datos con los procesos y proporciona información sobre las tendencias y patrones que afectan la eficiencia del proceso.
Formato del curso
El curso comienza con una descripción general de las técnicas más comúnmente utilizadas para la minería de procesos. Discutimos los diversos algoritmos y herramientas de descubrimiento de procesos utilizados para descubrir y modelar procesos basados en datos de eventos brutos. Se examinan los casos de estudio de la vida real y se analizan los conjuntos de datos utilizando el marco de código abierto ProM.
Introducción R para Biólogos
28 HorasR es un lenguaje de programación libre de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado seguidores entre los estadísticos, ingenieros y científicos sin habilidades de programación de computadoras que les resulta fácil de usar. Su popularidad se debe al uso cada vez mayor de la minería de datos para varios objetivos, como establecer precios de anuncios, encontrar nuevos medicamentos más rápidamente o ajustar los modelos financieros. R tiene una amplia variedad de paquetes para minería de datos.
Estadísticas con SPSS Software de Análisis Predictivo
14 HorasGoal:
Aprender a trabajar con SPSS a nivel de independencia
Los destinatarios:
Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y aprender técnicas populares de minería de datos.