О чём курс

Курс охватывает все основные аспекты работы с Apache Impala.

В ходе курса вы изучите устройство кластера Impala, в том числе компонентов, выполняющих запросы, координирующих работу кластера и хранящих метаданные.

В курсе подробно рассмотрены типы данных для столбцов таблицы и возможные операции с ними.

Вы изучите структуру запросов на выборку, варианты синтаксиса соединений и подзапросов.

Кроме того, вы разберетесь с форматами файлов данных, с которыми работает Impala, и способами загрузки данных в таблицы.

В кластерах Hadoop часто используют несколько SQL-инструментов для выполнения запросов. В курсе продемонстрированы отличия Impala от наиболее распространенного SQL-движка Hive, с точки зрения производительности, надежности и поддерживаемого синтаксиса.

Цели

После прохождения курса Вы сможете:
  • Анализировать данные в различных форматах с испольованием Impala;
  • Создавать различные типы таблиц и загружать в них данные;
  • Выполнять запросы на выборку данных;
  • Использовать пользовательские функции UDF;
  • Понимать, для каких задач лучше использовать Impala, а для каких – Hive.
  • Целевая аудитория

    Аналитики данных, разработчики, тестировщики.

    Предварительная подготовка

    Опыт использования SQL

    Для кого

    Data Scientist Data Scientist
    Big Data Analyst Big Data Analyst
    Data Engineer Data Engineer

    Улучшаемые навыки

    Apache Impala
    Big Data
    SQL
    UDF
    Data Analysi

    Инструменты

     HDFS HDFS
    Apache Impala Apache Impala

    Расписание курсов

    22.10.2025 - 24.10.2025

    10:00-14:00
    Дата и время:
    22.10.2025-24.10.2025
    10:00-14:00

    Middle 8 часов

    15 600 ₽

    14 040 ₽ — для физ. лиц

    Программа курса

    01 Кластер Impala и его компоненты
  • Кластер Impala и его задачи.
  • Обзор компонентов кластера Impala.
  • Разбор процесса выполнения запросов в Impala.
  • Практика: базовые операции с Impala
  • 02 Службы Impala
  • IMPALAD — планировщик и исполнитель запросов.
  • STATESTORED — хранитель состояния кластера.
  • CATALOGD — кеш метаданных таблиц
  • 03 Типы данных
  • Ознакомление с языком описания данных DDL
  • Изучение различных типов данных, используемых в Impala, включая строковые, численные, типы данных для дат и времени, логические и составные типы данных
  • Практика: типы данных, создание таблиц
  • 04 Запросы на выборку
  • Структура запроса Select
  • Обзор вариантов синтаксиса соединений
  • Изучение подзапросов
  • Практика: запросы на выборку
  • 05 Загрузка данных и UDF
  • Обзор идентификаторов и их использование в Impala
  • Анализ различных видов объектов базы данных и команд DDL
  • Рассмотрение синхронизации метаданных
  • Изучение различных видов таблиц и их создание
  • Освоение команд для изменения и удаления таблиц
  • Обзор возможностей для вставка данных, пакетной загрузки данных, изменения данных
  • Разбор пользовательских функций UDF
  • Практика: загрузка данных, работа с UDF
  • 06 Hive и Impala
  • Обзор сходств Hive и Impala
  • Анализ отличий Hive и Impala
  • 07 Итого 8 часов:теория — 3 часа (37%), практика — 5 часов (63%)

    15 600 ₽

    14 040 ₽ — для физ. лиц

    Записаться на курс

    Чему вы научитесь

    01 Анализировать данные в различных форматах с испольованием Impala.
    02 Создавать различные типы таблиц и загружать в них данные.
    03 Выполнять запросы на выборку данных.
    04 Использовать пользовательские функции UDF
    05 Понимать, для каких задач лучше использовать Impala, а для каких - Hive

    Курс проводят

    Александр

    Брейман Александр

    Эксперт в области разработки и архитектуры ПО

    Middle

    О тренере

    Александр занимается разработкой учебных программ, чтением лекций, проведением семинаров, практических и лабораторных работ. Под его руководством уже не один десяток специалистов успешно защитили выпускные квалификационные работы бакалавра и магистерские диссертации.

    Среди его кейсов работа в ЗАО «ТИТАН МЕТА», Московском государственном университете приборостроения и информатики, Национальном исследовательском университете «Высшая школа экономики» и Luxoft Training.

    Александр – кандидат технических наук, доцент. С 1991 г. занимается разработкой информационных и коммуникационных систем, за это время прошел путь от программиста до начальника отдела информационных систем.


    С 1994 г. преподает дисциплины, связанные с управлением данными, проектированием информационных систем и разработкой программного обеспечения.

    С 2014 г. Александр являлся штатным экспертом Luxoft Training по направлению «Разработка и архитектура ПО, СУБД Oracle», где занимается проведением тренингов, разработкой тренинговых программ и развитием данного направления.

    Курсы, сертификаты, членство в профессиональных организациях:

    2009 г. — повышение квалификации в Московском государственном университете приборостроения и информатики по программе «Информационная компетентность в профессиональной деятельности преподавателя вуза».

    2011 г. — повышение квалификации в Информационно-Вычислительном Центре Московского энергетического института (технического университета) по программе «Современные технологии построения баз данных на примере Microsoft SQL Server 2008. Web-приложения и современные средства разработки. Современные технологии построения компьютерных сетей с использованием Microsoft Windows Server 2008 R2».

    2024 г. — Сертифицированный тренер PostgreSQL по курсу DBA1 «Администрирование PostgreSQL 13. Базовый уровень».


    Курсы и сертификаты

    Александр является членом организаций:

    • IEEE, IEEE Computer Society (Institute of Electrical and Electronics Engineers / Институт инженеров электротехники и электроники).
    • ACM, ACM SIGMOD (Association for Computing Machinery / Ассоциация вычислительной техники).

    15 600 ₽

    14 040 ₽ — для физ. лиц

    Записаться на курс

    Записаться на курс

    15 600 ₽

    14 040 ₽ — для физ. лиц

    Юр. лицо — 15 600 ₽
    Физ. лицо — 14 040 ₽
    22.10.2025, Онлайн
    22.10.2025, Онлайн
    Открытая дата

    Связанные курсы

    EAS-015
    24 часа

    Основы Hadoop

    Освойте основы Hadoop и экосистемы Big Data. Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластерети сопутствующими проектами, составляющими экосистему Hadoop: Hive, Spark, HBase.

    от Middle

    44 000 ₽

    Наши ученики работают в:

    Наши клиенты

    Mail.ru
    Альфа-Банк, банковская группа
    Лаборатория Касперского
    Магнит, розничная сеть
    Спортмастер, сеть спортивных магазинов
    ПСБ
    Сбертех
    Дзен
    IT One
    Ростелеком
    Мегафон
    Nexign
    Ozon
    Декатлон
    X5 Group
    Технониколь
    Росатом
    Газпром
    Нлмк
    ВСК
    Синимекс

    Не нашли, что искали? — Просто напишите, и мы поможем

    Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
    Пользователь только что записался на курс ""
    Спасибо!
    Форма отправлена успешно.