Apache Spark Fundamentals

Apache Spark Fundamentals
Продолжительность
26 часы
Тип курсу
Онлайн
Мова
Англійська
Продолжительность
26 часы
Місцезнаходження
Онлайн
Мова
Англійська
Код
EAS-017
Тренінг для 7-8 чи більше людей? Налаштуйте тренінги для ваших конкретних потреб
Apache Spark Fundamentals
Продолжительность
26 часы
Місцезнаходження
Online
Мова
English
Код
EAS-017
€ 700 *
Тренінг для 7-8 чи більше людей? Налаштуйте тренінги для ваших конкретних потреб

опис

сертифікат
Після проходження курсу видається сертифікат
на бланку Luxoft Training

Цілі

During the training participants will:

  1. Write a Spark pipeline via functional Python and RDDs; 
  2. Write a Spark pipeline via Python, Spark DSL, Spark SQL and DataFrame; 
  3. Draw architecture with different sources; 
  4. Write a Spark pipeline with external systems (Kafka, Cassandra, Postgres) which works in parallel modes; 
  5. Resolve problems with slow joins. 

After the training, participants will be able to build a simple PySpark application and execute it on the cluster in parallel mode.

Цільова аудиторія

  • Software developers
  • Software architects

передумови

Basic Java, Python, Scala programming skills. Unix/Linux shell familiarity. Experience with databases is optional.

Дорожня карта

  • Spark concepts and architecture
  • Programming with RDDs: transformations and actions
  • Using key/value pairs
  • Loading and storing data
  • Accumulators and broadcast variables
  • Spark SQL, DataFrames, Datasets
  • Spark Streaming
  • Machine Learning using MLLib and Spark ML
  • Graph analysis using GraphX
Залишилися запитання?
Зв'яжітьсяз нами