Основы Impala
В ходе курса вы получите глубокое понимание Apache Impala и его возможностей для обработки и анализа данных. Вы изучите роль и компоненты кластера Impala, типы данных, запросы на выборку, загрузку данных и пользовательские функции UDF, а также сравнение Impala и Hive.
8 ак.ч.
Онлайн
EAS-019
Основы Impala
Записаться на курс
Длительность
8 ак.ч.
Локация
Онлайн
Код
EAS-019
Расписание и цены
14 900 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей
Основы Impala
Записаться на курс
Длительность
8 ак.ч.
Локация
Онлайн
Код
EAS-019
Расписание и цены
14 900 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей

Описание

Курс охватывает все основные аспекты работы с Apache Impala.

В ходе курса вы изучите устройство кластера Impala, в том числе компонентов, выполняющих запросы, координирующих работу кластера и хранящих метаданные.

В курсе подробно рассмотрены типы данных для столбцов таблицы и возможные операции с ними.

Вы изучите структуру запросов на выборку, варианты синтаксиса соединений и подзапросов.

Кроме того, вы разберетесь с форматами файлов данных, с которыми работает Impala, и способами загрузки данных в таблицы.

В кластерах Hadoop часто используют несколько SQL-инструментов для выполнения запросов. В курсе продемонстрированы отличия Impala от наиболее распространенного SQL-движка Hive, с точки зрения производительности, надежности и поддерживаемого синтаксиса.
После прохождения курса выдается
сертификат на бланке IBS Training Center

Цели

После прохождения курса Вы сможете:
  • Анализировать данные в различных форматах с испольованием Impala;
  • Создавать различные типы таблиц и загружать в них данные;
  • Выполнять запросы на выборку данных;
  • Использовать пользовательские функции UDF;
  • Понимать, для каких задач лучше использовать Impala, а для каких – Hive.

Целевая аудитория

Аналитики данных, разработчики, тестировщики.

Разбираемые темы

  • 1. Кластер Impala и его компоненты

    • Кластер Impala и его задачи.
    • Обзор компонентов кластера Impala.
    • Разбор процесса выполнения запросов в Impala.
    • Практика – базовые операции с Impala
  • 2. Службы Impala

    • IMPALAD – планировщик и исполнитель запросов.
    • STATESTORED – хранитель состояния кластера.
    • CATALOGD – кеш метаданных таблиц
  • 3. Типы данных

    • Ознакомление с языком описания данных DDL
    • Изучение различных типов данных, используемых в Impala, включая строковые, численные, типы данных для дат и времени, логические и составные типы данных
    • Практика – типы данных, создание таблиц
  • 4. Запросы на выборку

    • Структура запроса Select
    • Обзор вариантов синтаксиса соединений
    • Изучение подзапросов
    • Практика – запросы на выборку
  • 5. Загрузка данных и UDF

    • Обзор идентификаторов и их использование в Impala
    • Анализ различных видов объектов базы данных и команд DDL
    • Рассмотрение синхронизации метаданных
    • Изучение различных видов таблиц и их создание
    • Освоение команд для изменения и удаления таблиц
    • Обзор возможностей для вставка данных, пакетной загрузки данных, изменения данных
    • Разбор пользовательских функций UDF
    • Практика – загрузка данных, работа с UDF
  • 6. Hive и Impala

    • Обзор сходств Hive и Impala
    • Анализ отличий Hive и Impala
  • Итого 8 часов: теория – 3 ч. (37%), практика – 5 ч. (63%)

  • Развернуть программу
Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
+
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.