EAS-015

Основы Hadoop

Освойте основы Hadoop и экосистемы Big Data. Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластерети сопутствующими проектами, составляющими экосистему Hadoop: Hive, Spark, HBase.

Удостоверение о прохождении

Смотреть пример

24 академ. часов

Онлайн

Подробнее

Улучшаемые навыки

Hadoop

HDFS

YARN

Hive

Spark

HBase

Big Data

Data Engineering

SQL

MapReduce

Инструменты

Apache HBase

HDFS

Spark

YARN

Чему вы научитесь

01 Понимать ключевые концепции и архитектуру Hadoop;

02 Записывать и читать данные в/из HDFS;

03 Понимать устройство MapReduce-программ;

04 Обращаться к табличным данным с использованием Hive;

05 Обращаться к табличным данным с использованием Spark SQL/DataFrame в пакетном режиме;

06 Обрабатывать потоки данных с использованием Spark Structured Streaming;

07 Использовать HBase для низколатентного сохранения и чтения данных.

Программа курса

01 Основные концепции современной архитектуры данных

⠀

02 HDFS: Hadoop Distributed File System

Архитектура, репликация, чтение и запись данных, команды HDFS.

Практика: подключение к кластеру, работа с файловой системой из shell и Hue.

03 Парадигма MapReduce и ее реализация на Java и в Hadoop Streaming

Практика: запуск приложений.

04 YARN: управление распределенным выполнением приложений

Архитектура YARN, запуск приложений в YARN.

Практика: запуск приложений и наблюдение за кластером через UI.

05 Введение в Hive

Архитектура, метаданные таблиц, форматы файлов, язык запросов HiveQL.

Практика (Hue, hive, beeline, Tez UI): создание таблиц, чтение и запись CSV, Parquet, ORC, партиционирование, SQL-запросы с агрегацией и соединениями.

06 Введение в Spark

DataFrame/SQL, метаданные, форматы файлов, источники данных, RDD.

Практика (Zeppelin, Spark UI): чтение и запись из БД (JDBC), CSV, Parquet, партиционирование, SQL-запросы с агрегацией и соединениями, планы выполнения запросов, мониторинг.

07 Введение в потоковую обработку данных

Spark Streaming, Spark Structured Streaming, Flink.

Практика: чтение/обработка/запись потоков между Kafka, реляционной БД и файловой системой.

08 Введение в HBase

Архитектура, язык запросов.

Практика (HBase shell): запись и чтение данных.

09 Итого на курс 24 часов: теория – 13 ч ( 54%), практика – 11ч ( 46%)

46 200 ₽

41 580 ₽ — для физ. лиц

Записаться на курс

Для кого

Data Engineer

Big Data Analyst

Data Scientist

Предварительная подготовка

Умение работать в командной оболочке Unix/Linux (bash). Опыт работы с базами данных желателен, но не обязателен.

Расписание курсов

02.03.2026 - 06.03.2026

Дата и время:

02.03.2026-06.03.2026

Тренер: Брейман Александр

Middle 24 часа

46 200 ₽

41 580 ₽ — для физ. лиц

Записаться

Смотреть полное расписание

Курс проводят

Брейман Александр

Эксперт в области разработки и архитектуры ПО

О тренере

Александр занимается разработкой учебных программ, чтением лекций, проведением семинаров, практических и лабораторных работ. Под его руководством уже не один десяток специалистов успешно защитили выпускные квалификационные работы бакалавра и магистерские диссертации.

Среди его кейсов работа в ЗАО «ТИТАН МЕТА», Московском государственном университете приборостроения и информатики, Национальном исследовательском университете «Высшая школа экономики» и Luxoft Training.

Александр – кандидат технических наук, доцент. С 1991 г. занимается разработкой информационных и коммуникационных систем, за это время прошел путь от программиста до начальника отдела информационных систем.

С 1994 г. преподает дисциплины, связанные с управлением данными, проектированием информационных систем и разработкой программного обеспечения.

С 2014 г. Александр являлся штатным экспертом Luxoft Training по направлению «Разработка и архитектура ПО, СУБД Oracle», где занимается проведением тренингов, разработкой тренинговых программ и развитием данного направления.

Курсы, сертификаты, членство в профессиональных организациях:

2009 г. — повышение квалификации в Московском государственном университете приборостроения и информатики по программе «Информационная компетентность в профессиональной деятельности преподавателя вуза».

2011 г. — повышение квалификации в Информационно-Вычислительном Центре Московского энергетического института (технического университета) по программе «Современные технологии построения баз данных на примере Microsoft SQL Server 2008. Web-приложения и современные средства разработки. Современные технологии построения компьютерных сетей с использованием Microsoft Windows Server 2008 R2».

2024 г. — Сертифицированный тренер PostgreSQL по курсу DBA1 «Администрирование PostgreSQL 13. Базовый уровень».

Курсы и сертификаты

Александр является членом организаций:

IEEE, IEEE Computer Society (Institute of Electrical and Electronics Engineers / Институт инженеров электротехники и электроники).
ACM, ACM SIGMOD (Association for Computing Machinery / Ассоциация вычислительной техники).

46 200 ₽

41 580 ₽ — для физ. лиц

Записаться на курс

46 200 ₽

41 580 ₽ — для физ. лиц

Юр. лицо — 46 200 ₽

Физ. лицо — 41 580 ₽

02.03.2026, Онлайн

Ознакомлен с политикой обработки персональных данных

Cоглашаюсь с условиями обработки персональных данных

Отзывы о курсе

Повысьте квалификацию И получите диплом

Отзывы учеников

Читать все отзывы

Для меня очень полезным было рассмотрение архитектуры технологий, относящихся к Hadoop; понимание плюсов и минусов использования Hadoop, областей применения данных технологий. Очень понравился стиль изложения материала, метод преподавания тренера, эмоциональные ударения, удержание внимания аудитории.

Имя Ф.

Отличный тренинг. Получил общее понимание Hadoop и приложений из его экосистемы. Узнал цели использования, плюсы, минусы и т.п. Основы Spark и его преимущества/недостатки по сравнению с Hadoop. Спасибо!

Имя Ф.

Отличный курс: комплексный подход к изложению: доступно, понятно, кратко, с примерами. Общий обзор продуктов, интересные реальные примеры. Особенно описание внутреннего устройства hdfs, Vanilla Hadoop, Apache Spark.

Имя Ф.

Очень приятные впечатления от курса - от организации до наполнения. Обучение позволило собрать воедино разрозненные обрывки знаний и в дискуссиях с коллегами и тренером - повысить компетенцию.

Имя Ф.

Насыщенность курса превысила ожидания. Помимо верхнеуровневой архитектуры удалось познакомиться и с более низкоуровневыми особенностями и подходами к реализации и использованию.

Имя Ф.

Тренингом очень доволен, качественное погружение в интересующие аудиторию детали, алгоритмы. Тренер активно работает с аудиторией, грамотно и доступно преподносит материал.

Имя Ф.

Для меня это был полезный курс. Я узнал, как устроены компоненты больших данных, и получил практический опыт их использования. В общем, очень понравилась практическая часть – это большой «плюс» тренинга. Отдельно спасибо за блоки с информацией про историю развития Hadoop, общее понимание технологий и экосистемы. Это было интересно, рекомендую.

Имя Ф.

Хороший курс. Все темы были для меня чем-то новым, но интересным и полезным. В целом было много теории и упор на основные механизмы, но нам дали возможность потренироваться на стендах, выполнить домашние задания и разобрать их вместе с тренером. После курса для меня многое стало понятным, и я вдохновился на дальнейшее самообучение – это главное!

Имя Ф.

Все хорошо. Самая полезная часть курса – это информация про то, что представляет из себя хауоп, как его установить и конфигурировать, материалы о командах HDFS, вендорах и других составляющих (нам рассказали про Pig, Hive, Sqoop, Flume и др.). Я думаю, что этот курс, подходит для разработчиков или инженеров по обработке данных, которые строят инфраструктуру, поэтому, могу смело рекомендовать им обучение.

Имя Ф.

Рассмотрено много возможностей Hadoop. Стало понятно, что развиваться в нём можно бесконечно :)

Михаил Талягин

Наши ученики работают в:

Наши клиенты

Связанные курсы

EAS-016

8 часов

BigData SQL: Hive

В курсе изучаются основы архитектуры Hive , разработка скриптов по загрузке, трансформации и выгрузке данных. Рассматриваются все необходимые технические подробности. Конфигурирование и настройки производительности.

от Middle

16 400 ₽

EAS-017

26 часов

Основы Apache Spark

Обучайтесь основам Apache Spark и используйте его для эффективной обработки больших данных. В данном курсе вы узнаете все необходимое для работы с фреймворком Apache Spark, включая программирование на Python, создание табличных запросов с помощью Spark SQL и обработку данных с использованием RDD и DataFrame. Уникальное сочетание теории и практики поможет вам быстро освоить все нюансы Spark и применить их на реальных проектах.

от Middle

49 700 ₽

EAS-024

24 часа

Фреймворк Apache Spark для разработчиков: продвинутый уровень

Глубокое погружение в внутреннее устройство Apache Spark и его компонентов. Этот курс поможет вам понять, как устроены и работают различные модули Spark, такие как Spark Core, Spark SQL, и Spark Streaming. Вы научитесь оптимизировать производительность и эффективно использовать ресурсы кластера.

от Senior

54 500 ₽

Ознакомлен с политикой обработки персональных данных

Cоглашаюсь с условиями обработки персональных данных

Основы Hadoop

46 200 ₽

Улучшаемые навыки

Инструменты

Чему вы научитесь

Программа курса

46 200 ₽

Для кого

Предварительная подготовка

Расписание курсов

Курс проводят

Брейман Александр

О тренере

Курсы и сертификаты

Александр является членом организаций:

46 200 ₽

Записаться на курс

Отзывы о курсе

Наши ученики работают в:

Наши клиенты

Связанные курсы

Не нашли, что искали? — Просто напишите, и мы поможем