Улучшаемые навыки

Apache Impala
Big Data
SQL
UDF
Data Analysis

Инструменты

 HDFS HDFS
Apache Impala Apache Impala

Чему вы научитесь

01 Анализировать данные в различных форматах с испольованием Impala.
02 Создавать различные типы таблиц и загружать в них данные.
03 Выполнять запросы на выборку данных.
04 Использовать пользовательские функции UDF.
05 Понимать, для каких задач лучше использовать Impala, а для каких — Hive.

Программа курса

01 Кластер Impala и его компоненты
  • Кластер Impala и его задачи.
  • Обзор компонентов кластера Impala.
  • Разбор процесса выполнения запросов в Impala.
  • Практика: базовые операции с Impala
  • 02 Службы Impala
  • IMPALAD — планировщик и исполнитель запросов.
  • STATESTORED — хранитель состояния кластера.
  • CATALOGD — кеш метаданных таблиц
  • 03 Типы данных
  • Ознакомление с языком описания данных DDL
  • Изучение различных типов данных, используемых в Impala, включая строковые, численные, типы данных для дат и времени, логические и составные типы данных
  • Практика: типы данных, создание таблиц
  • 04 Запросы на выборку
  • Структура запроса Select
  • Обзор вариантов синтаксиса соединений
  • Изучение подзапросов
  • Практика: запросы на выборку
  • 05 Загрузка данных и UDF
  • Обзор идентификаторов и их использование в Impala
  • Анализ различных видов объектов базы данных и команд DDL
  • Рассмотрение синхронизации метаданных
  • Изучение различных видов таблиц и их создание
  • Освоение команд для изменения и удаления таблиц
  • Обзор возможностей для вставка данных, пакетной загрузки данных, изменения данных
  • Разбор пользовательских функций UDF
  • Практика: загрузка данных, работа с UDF
  • 06 Hive и Impala
  • Обзор сходств Hive и Impala
  • Анализ отличий Hive и Impala
  • 07 Итого 8 часов:теория — 3 часа (37%), практика — 5 часов (63%)

    17 500 ₽

    15 750 ₽ — для физ. лиц

    Записаться на курс

    Для кого

    Data Scientist Data Scientist
    Big Data Analyst Big Data Analyst
    Data Engineer Data Engineer

    Предварительная подготовка

    Опыт использования SQL

    17 500 ₽

    15 750 ₽ — для физ. лиц

    Записаться на курс

    Записаться на курс

    17 500 ₽

    15 750 ₽ — для физ. лиц

    Юр. лицо — 17 500 ₽
    Физ. лицо — 15 750 ₽
    Открытая дата

    Наши ученики работают в:

    Наши клиенты

    Mail.ru
    Альфа-Банк, банковская группа
    Лаборатория Касперского
    Магнит, розничная сеть
    Спортмастер, сеть спортивных магазинов
    ПСБ
    Сбертех
    Дзен
    IT One
    Ростелеком
    Мегафон
    Nexign
    Ozon
    Декатлон
    X5 Group
    Технониколь
    Росатом
    Газпром
    Нлмк
    ВСК
    Синимекс

    Связанные курсы

    EAS-015
    24 часа

    Основы Hadoop

    Освойте основы Hadoop и экосистемы Big Data. Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластерети сопутствующими проектами, составляющими экосистему Hadoop: Hive, Spark, HBase.

    от Middle

    47 500 ₽

    Нужна помощь? Оставьте заявку, и мы свяжемся с вами в ближайшее время

    Согласен получать на e-mail информационные рассылки о новостях Учебного центра IBS
    Корпоративное обучение Оценка персонала Сертификация О нас Стать тренером Блог Личный кабинет
    Пользователь только что записался на курс ""
    Спасибо!
    Форма отправлена успешно.