Основы Apache Spark
Курс дает представление об основах Apache Spark и методах разработки приложений, обрабатывающих данные на его основе. Рассматриваются как базовые возможности Spark (RDD), так и проекты, расширяющие их набор: Spark SQL, Spark Streaming, MLLib, Spark ML, GraphX.
24 ак.ч.
Онлайн
EAS-017
Основы Apache Spark
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-017
Расписание и цены
40 000 руб.
Планируете обучить команду из 7-8 или более человек?
Закажите корпоративное обучение с учетом ваших потребностей
Основы Apache Spark
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-017
Расписание и цены
40 000 руб.
Планируете обучить команду из 7-8 или более человек?
Закажите корпоративное обучение с учетом ваших потребностей

Описание

Курс дает представление об основах Apache Spark и методах разработки приложений, обрабатывающих данные на его основе. Рассматриваются как базовые возможности Spark  (RDD), так и проекты, расширяющие их набор: Spark SQL, Spark Streaming, MLLib, Spark ML, GraphX.

После прохождения курса выдается
сертификат на бланке IBS Training Center

Цели

  • Понимать ключевые концепции и архитектуру Spark;
  • Разрабатывать программы обработки данных как последовательности преобразований RDD;
  • Разрабатывать программы обработки данных на SQL;
  • Обрабатывать потоковые данные;
  • Использовать готовые алгоритмы машинного обучения и анализа графов;
  • Уметь переносить данные между Spark и внешними системами (Kafka, Cassandra).

Целевая аудитория

Разработчики, архитекторы.

Предварительная подготовка

  • базовые навыки программирования на Java;
  • умение работать в командной оболочке Unix/Linux (bash);
  • опыт работы с базами данных желателен, но не обязателен.

Разбираемые темы

  • Основные концепции и архитектура Spark;
  • Программирование с RDD;
  • Использование RDD с парами ключ/значение;
  • Загрузка и сохранение данных;
  • Аккумуляторы и широковешательные переменные;
  • Spark SQL, DataFrames, Datasets;
  • Spark Streaming;
  • Машинное обучение с использованием MLLib и Spark ML;
  • Анализ графов с использованием GraphX.

Примечание

Материалы курса представлены на английском языке.
Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
+
Отзывы (3)
Спасибо за курс! Мы изучили основы использования одного из самых популярных фреймворков, и я наконец-то понял, как он работает 😊 хорошо, что всю информацию нам «разжёвывали», поэтому все было понятно. Понравился очень глубокий анализ каждого случая, практические примеры обзор Spark, практические упражнения с RDD, DataFrame, DataSet и домашние задания.
Участник тренинга
Не думал, что изучение BigData может быть таким простым и интересным с одной стороны, и объёмным и информативным с другой. Больше всего понравился широкий обзор ключевых концепций и методов обработки данных с помощью Spark и глубокое объяснение всей экосистемы Spark. Поэтому считаю, что вся информация, которую мы обсудили, была важной и полезной. Курс понравился, рекомендую!
Участник тренинга
Когда я записывался на курс, то хотел изучить Apache Spark. К моему счастью, моя цель была достигнута. Главные «плюсы» курсы для меня – это материалы об архитектуре, RDD, Spark SQL, DataFrames, Datasets и возможность упражняться. Все задания проверял тренер, он давал рекомендации и помогал выполнить задания, с которыми у нас были трудности. В общем, все супер!
Участник тренинга
Показать все отзывы
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.