Programa del Curso

Introducción

  • Información general sobre Databricks y Apache Spark
  • Descripción de la arquitectura Databricks

Empezar

  • Configuración del entorno
  • Instalación y configuración Databricks
  • Navegación por la interfaz de usuario Databricks
  • Creación de un espacio de trabajo Databricks

Trabajar con datos en Databricks

  • Conexión a una fuente de datos Apache Spark
  • Descripción de los conceptos básicos de las columnas y los tipos de datos
  • Administración del sistema de archivos en blocs de notas

Administración de trabajos y clústeres

  • Creación y configuración de clústeres
  • Creación de trabajos con Notebook
  • Ejecución de trabajos
  • Visualización de trabajos y detalles del trabajo

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake
  • Administración de datos en Delta Lake

Aseguramiento Databricks

  • Gestión de Databricks la seguridad
  • Gestión de copias de seguridad y recuperación

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de análisis de datos
  • Conocimiento de Apache Spark

Audiencia

  • Ingenieros de datos
  • Científicos de datos
  • Desarrolladores
  14 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (2)

Cursos Relacionados

Azure for Data Engineer

  35 horas

Análisis de datos para vendedores

  14 horas

Categorías Relacionadas