Programa del Curso

Introducción

Descripción general de Apache Spark Características y arquitectura

  • Módulos de Apache Spark: Spark SQL, Spark Streaming, MLlib, GraphX
  • RDD, Dataframes, drive-workers, DAG, etc.

Configuración Apache Spark en .NET

  • Preparación de la máquina virtual Java
  • Ejecución de .NET para Apache Spark con .NET Core

Empezar

  • Creación de una aplicación de consola .NET de ejemplo
  • Adición del controlador de Spark
  • Inicialización de una SparkSession
  • Ejecución de la aplicación

Preparación de datos

  • Creación de una canalización de preparación de datos
  • Realización de ETL (extracción, transformación y carga)

Machine Learning

  • Creación de un modelo de aprendizaje automático
  • Preparación de los datos
  • Entrenamiento de un modelo

Procesamiento en tiempo real

  • Datos de streaming procesados en tiempo real
  • Caso práctico: monitorización de datos de sensores

Consulta interactiva

  • Trabajar con Spark SQL
  • Análisis de datos estructurados

Visualización de resultados

  • Representación gráfica de los resultados
  • Uso de herramientas de terceros para visualizar los resultados

Solución de problemas

Resumen y conclusión

Requerimientos

  • Experiencia en programación .NET con C# o F#

Audiencia

  • Desarrolladores
  21 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (9)

Cursos Relacionados

Categorías Relacionadas