ClickHouse: эффективная работа с данными
Эффективное применение ClickHouse для обработки большого количества данных.
24 ак.ч.
Онлайн
EAS-033
ClickHouse: эффективная работа с данными
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-033
Расписание и цены
52 500 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей
ClickHouse: эффективная работа с данными
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-033
Расписание и цены
52 500 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей

Описание

Курс начинается с рассмотрения архитектурных особенностей ClickHouse, что важно для понимания его функционирования.

Рассматриваются колоночный формат хранения данных, разреженный индекс, шардирование, репликация данных и другие важные особенности. Делается сравнение с другими популярными инструментами для работы с большими данными - GreenPlum, Hadoop, рассматриваются основные возможности и область эффективного применения ClickHouse.

Далее даётся описание стратегии выбора подходящего релиза, развёртывание кластера ClickHouse из нескольких узлов на обычных серверах и в Docker, первоначальное конфигурирование и запуск.

Далее рассматриваются основные объекты СУБД: базы данных, таблицы, основные виды представлений, работа с ролевой моделью и настройкой квот для пользователей.

После этого подробно рассматривается работа с собственным клиентом командной строки.

Подробно рассматриваются лучшие практики использования ClickHouse. Среди них, например, индексы различных типов, партиционирование, эффективное шардирование, выбор подходящего движка таблиц, оптимизация таблиц для эффективного хранения больших объёмов данных, а также способы оптимизации запросов.

В конце курса описываются имеющиеся в ClickHouse возможности для взаимодействия со средой Hadoop с использованием эффективных форматов данных.

Цели

Приобретение навыков эффективного применения ClickHouse для онлайн обработки больших данных.

Целевая аудитория

Разработчики, системные аналитики (при условии прохождения тестирования)

Предварительная подготовка

Специалисты, владеющие на базовом уровне SQL, Bash, Docker.

Разбираемые темы

  • 1.Введение: Область применения ClickHouse, отличие от других СУБД, ограничения столбцовой системы (2 ак.ч)

  • 2.Запуск и подключение (2 ак.ч)

  • 3.Объекты баз данных (4 ак.ч)

  • 4.Интерфейс командной строки клиента (2 ак.ч)

  • 5.Лучшие практики ClickHouse (4 ак.ч)

  • 6.Основные возможности ClickHouse (4 ак.ч)

  • 7.Работа в среде Hadoop (3 ак.ч)

  • 8.Анализ и оптимизация запросов и оптимизация структуры таблиц (3 ак.ч)

  • Итого на курс 24 ак. часа: теория – 7,2 ч (30%), практика – 16,8 ч (50%)

  • Развернуть программу
Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
+
Связанные курсы
Основы Linux
Цель настоящего курса – дать обзор операционных систем Linux с точки зрения пользователя Linux и начинающего системного администратора. Курс нацелен на отработку практических навыков, но уделяет должное внимание и теоретическим вопросам. Данный курс будет полезен тестировщикам Unix-систем, инженерам по автоматизации тестирования, разработчикам, использующим bash-подобные оболочки, а также тем, кто хотел бы структурировать свои знания.
Онлайн:
18.11.2024 - 27.11.2024
Основы Docker
В данном курсе рассматриваются основные сведения о платформе Docker: архитектура Docker, запуск приложений и сервисов, устранение неполадок, работа с образами и создание собственных образов, хранение постоянных данных с помощью томов и сетевое взаимодействие. Также вас ждет множество практических заданий по всем аспектам изучаемого материала.
Онлайн:
11.11.2024 - 15.11.2024
Основы Hadoop
Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластере и сопутствующими проектами, входящими в экосистему Hadoop: Hive, Spark, HBase.
Онлайн:
09.12.2024 - 13.12.2024
Смотреть каталог
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.