Улучшаемые навыки
Аналитические СУБД
RT.WideStore
Шардирование
Репликация
Оптимизация запросов
MergeTree
Материализованные представления
Интеграция данных
Векторная обработка
Инструменты
Clickhouse
DBeaver
RT.ClusterManager
RT.Widestore
Чему вы научитесь
01
Развёртыванию и эксплуатации кластера RT.WideStore – освоите установку, настройку и поддержку работоспособности кластера.
02
Проектированию архитектуры приложений на основе RT.WideStore – научитесь создавать эффективные и масштабируемые решения.
03
Работе с окружением RT.WideStore – поймёте, как правильно настраивать и поддерживать инфраструктуру.
04
Управлению кластером – изучите основные операции администрирования, включая масштабирование и балансировку нагрузки.
05
Загрузке и выгрузке данных – освоите методы эффективного импорта и экспорта данных в RT.WideStore.
06
Интеграции с внешними источниками – научитесь подключать и настраивать взаимодействие с другими системами и API.
07
Настройке безопасности – узнаете, как защитить данные и настроить права доступа.
08
Мониторингу работы кластера – познакомитесь с инструментами отслеживания производительности и диагностики проблем.
Программа курса
01
Введение в RT.WideStore
Базовые сведения об RT.WideStore. Архитектура кластера.
Отличия RT.WideStore от RT.WideStore (Greenplum) и RT.DataLake (Hadoop).
RT.ClusterManager. Онлайн и офлайн установка.Требования к железу, сайзинг кластера
Управление БД. Запуск, остановка, обновление СУБД.
Директории и файлы. Начало работы. Работа с клиентом командной строки. Подключение при помощи внешнего клиента.
Файлы конфигурации – структура (пользователи, системные настройки и т.д.) и как ими управлять из CM (макросы и т.д., Возможность устанавливать конфигурационные файлы из git-репозитория)
Логи кластера и примеры разбора кейсов
Базовые объекты. Структура БД.
Ролевая модель. Взаимодействие с LDAP и AD.
Мониторинг. Структура и обзор метрик. Снятие пользовательских метрик через sql_exporter
Кластерный режим – реплики и шарды, как менять топологию из CM
Zookeeper, clickhosue-keeper
Инструменты бэкапирования
Квоты
Профилировщик запросов
02
Хранение и выборка данных
Типы данных.
Словари и работа с ними
Движки таблиц
Схема хранения данных в MergeTree.
Первичный индекс.
Дополнительные индексы.
Сжатие данных. TTL.
Распределенные таблицы. Репликация и шардирование.
Манипуляции над таблицей и данными. Мутации. Операции с партициями и кусками.
Специальные варианты MergeTree. Агрегирующие функции и материализованные представления.
Способы загрузки данных.
Выгрузка данных из ClickHouse.
Взаимодействие с внешними системами. Движки таблиц для интеграции.
Внешние и внутренние словари.
04
Итого на курс 20 часов: теория – 10 ч (50%), практика – 10 ч (50%)
Для кого
Системный администратор
DevOps-инженер
Data Engineer
Архитектор ПО
Предварительная подготовка
Базовые знания работы ОС;
Знание SQL.