О чём курс

Курс начинается с рассмотрения архитектурных особенностей ClickHouse, что важно для понимания его функционирования.

Рассматриваются колоночный формат хранения данных, разреженный индекс, шардирование, репликация данных и другие важные особенности. Делается сравнение с другими популярными инструментами для работы с большими данными - GreenPlum, Hadoop, рассматриваются основные возможности и область эффективного применения ClickHouse.

Далее даётся описание стратегии выбора подходящего релиза, развёртывание кластера ClickHouse из нескольких узлов на обычных серверах и в Docker, первоначальное конфигурирование и запуск.

Далее рассматриваются основные объекты СУБД: базы данных, таблицы, основные виды представлений, работа с ролевой моделью и настройкой квот для пользователей.

После этого подробно рассматривается работа с собственным клиентом командной строки.

Подробно рассматриваются лучшие практики использования ClickHouse. Среди них, например, индексы различных типов, партиционирование, эффективное шардирование, выбор подходящего движка таблиц, оптимизация таблиц для эффективного хранения больших объёмов данных, а также способы оптимизации запросов.

В конце курса описываются имеющиеся в ClickHouse возможности для взаимодействия
со средой Hadoop с использованием эффективных форматов данных.

Цели

Приобретение навыков эффективного применения ClickHouse для онлайн обработки больших данных.

Целевая аудитория

Разработчики, системные аналитики (при условии прохождения тестирования)

Предварительная подготовка

Специалисты, владеющие на базовом уровне SQL, Bash, Docker.

Улучшаемые навыки

Основы ClickHouse и его архитектура
Создание и управление таблицами
Запросы и аналитика
Оптимизация производительности запросов
Интеграция с инструментами анализа данных

Программа курса

01 Введение: Область применения ClickHouse, отличие от других СУБД, ограничения столбцовой системы (2 ак.ч)
02 Запуск и подключение (2 ак.ч)
03 Объекты баз данных (4 ак.ч)
04 Интерфейс командной строки клиента (2 ак.ч)
05 Лучшие практики ClickHouse (4 ак.ч)
06 Основные возможности ClickHouse (4 ак.ч)
07 Работа в среде Hadoop (3 ак.ч)
08 Анализ и оптимизация запросов и оптимизация структуры таблиц (3 ак.ч)
09 Итого на курс 24 ак. часа: теория – 7,2 ч (30%), практика – 16,8 ч (70%)

59 900 ₽

53 910 ₽ — для физ. лиц

Записаться на курс

Чему вы научитесь

01 Научитесь основным концепциям и архитектуре ClickHouse, включая его особенности как колоночной базы данных
02 Освоите методы создания и управления таблицами в ClickHouse, включая выбор типов данных и параметры хранения
03 Научитесь писать SQL-запросы для извлечения и анализа данных в ClickHouse, включая использование агрегатных функций, оконных функций и JOIN
04 Освоите методы оптимизации производительности запросов в ClickHouse, включая использование индексов, партиционирования и настройки конфигурации
05 Научитесь интегрировать ClickHouse с различными инструментами для анализа данных и визуализации, такими как Tableau и Apache Superset

59 900 ₽

53 910 ₽ — для физ. лиц

Записаться на курс

Записаться на курс

59 900 ₽

53 910 ₽ — для физ. лиц

Юр. лицо — 59 900 ₽
Физ. лицо — 53 910 ₽
Открытая дата

Связанные курсы

ADM-007
17 часов

Основы Linux

Курс нацелен на отработку практических навыков, но уделяет должное внимание и теоретическим вопросам. Данный курс будет полезен тестировщикам Unix-систем, инженерам по автоматизации тестирования, разработчикам, использующим bash-подобные оболочки, а также тем, кто хотел бы структурировать свои знания.

от Junior

21 300 ₽

ADM-019
20 часов

Основы Docker

В данном курсе рассматриваются основные сведения о платформе Docker: архитектура Docker, запуск приложений и сервисов, устранение неполадок, работа с образами и создание собственных образов, хранение постоянных данных с помощью томов и сетевое взаимодействие. Также вас ждет множество практических заданий по всем аспектам изучаемого материала.

от Middle

29 900 ₽

EAS-015
24 часа

Основы Hadoop

Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластере и сопутствующими проектами, входящими в экосистему Hadoop: Hive, Spark, HBase.

от Middle

44 000 ₽

Наши ученики работают в:

Наши клиенты

Mail.ru
Альфа-Банк, банковская группа
Лаборатория Касперского
Магнит, розничная сеть
Спортмастер, сеть спортивных магазинов
ПСБ
Сбертех
Дзен
IT One
Ростелеком
Мегафон
Nexign
Ozon
Декатлон
X5 Group
Технониколь
Росатом
Газпром
Нлмк
ВСК
Синимекс

Не нашли, что искали? — Просто напишите, и мы поможем

Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.