Описание
Курс начинается с рассмотрения архитектурных особенностей ClickHouse, что важно для понимания его функционирования.
Рассматриваются колоночный формат хранения данных, разреженный индекс, шардирование, репликация данных и другие важные особенности. Делается сравнение с другими популярными инструментами для работы с большими данными - GreenPlum, Hadoop, рассматриваются основные возможности и область эффективного применения ClickHouse.
Далее даётся описание стратегии выбора подходящего релиза, развёртывание кластера ClickHouse из нескольких узлов на обычных серверах и в Docker, первоначальное конфигурирование и запуск.
Далее рассматриваются основные объекты СУБД: базы данных, таблицы, основные виды представлений, работа с ролевой моделью и настройкой квот для пользователей.
После этого подробно рассматривается работа с собственным клиентом командной строки.
Подробно рассматриваются лучшие практики использования ClickHouse. Среди них, например, индексы различных типов, партиционирование, эффективное шардирование, выбор подходящего движка таблиц, оптимизация таблиц для эффективного хранения больших объёмов данных, а также способы оптимизации запросов.
В конце курса описываются имеющиеся в ClickHouse возможности для взаимодействия со средой Hadoop с использованием эффективных форматов данных.удостоверение о повышении квалификации государственного образца
Цели
Целевая аудитория
Предварительная подготовка
Разбираемые темы
-
1.Введение: Область применения ClickHouse, отличие от других СУБД, ограничения столбцовой системы (2 ак.ч)
-
2.Запуск и подключение (2 ак.ч)
-
3.Объекты баз данных (4 ак.ч)
-
4.Интерфейс командной строки клиента (2 ак.ч)
-
5.Лучшие практики ClickHouse (4 ак.ч)
-
6.Основные возможности ClickHouse (4 ак.ч)
-
7.Работа в среде Hadoop (3 ак.ч)
-
8.Анализ и оптимизация запросов и оптимизация структуры таблиц (3 ак.ч)
-
Итого на курс 24 ак. часа: теория – 7,2 ч (30%), практика – 16,8 ч (50%)