Фреймворк Apache Spark для разработчиков: продвинутый уровень
Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL и Spark Streaming.
24 ак.ч.
Онлайн
EAS-024
Фреймворк Apache Spark для разработчиков: продвинутый уровень
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-024
Расписание и цены
40 000 руб.
Планируете обучить команду из 7-8 или более человек?
Закажите корпоративное обучение с учетом ваших потребностей
Фреймворк Apache Spark для разработчиков: продвинутый уровень
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-024
Расписание и цены
40 000 руб.
Планируете обучить команду из 7-8 или более человек?
Закажите корпоративное обучение с учетом ваших потребностей

Описание

Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL, Spark Streaming и Spark Structured Streaming. Рассматриваются механизмы запуска компонентов кластера Spark под управлением разных менеджеров кластеров, управление выделением ресурсов (в первую очередь – памяти), механизмы работы планировщиков. Подробно исследуются преимущества формата внутреннего представления Tungsten и работы оптимизатора Catalyst. 

Цели

  • Понимать внутреннее устройство Spark;
  • Понимать механизмы запуска и настройки компонентов Spark на разных кластерах (Standalone, YARN, Mesos);
  • Научиться оптимизировать программы, обрабатывающие RDD;
  • Понимать механизмы оптимизации программ на Spark SQL;
  • Понимать механизмы оптимизации программ, обрабатывающих потоковые данные, как в микропакетах, так и в Dataset.

Целевая аудитория

Разработчики, архитекторы

Предварительная подготовка

Опыт разработки на Java или Scala под Apache Spark от 3 месяцев. 

Разбираемые темы

  • Внутренняя архитектура Spark, Spark Runtime Environment

  • Настройка Spark Context, SparkConf

  • Внутреннее устройство RDD, логический план

  • Лучшие практики программирования с RDD

  • Физический план: работы, стадии, задачи

  • Планировщики и выполнение физического плана

  • Настройка памяти, сериализация, кеширование, сборка мусора

  • Datasource API, внутреннее представление данных Tungsten, форматы файлов

  • Оптимизатор Catalyst

  • Микропакетный Spark Streaming: получение и выдача данных

  • Structured Streaming: получение и выдача данных

Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
+
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.