Улучшаемые навыки
Аналитические СУБД
RT.WideStore
Шардирование
Репликация
Оптимизация запросов
MergeTree
Материализованные представления
Интеграция данных
Векторная обработка
Инструменты
Clickhouse
DBeaver
RT.ClusterManager
RT.Widestore
Чему вы научитесь
01
Настраивать и администрировать кластер RT.WideStore
02
Оптимизировать хранение данных с помощью движков MergeTree.
03
Реализовывать шардирование и репликацию для отказоустойчивости.
04
Использовать материализованные представления и проекции.
05
Интегрировать RT.WideStore с внешними источниками данных.
Программа курса
01
Особенности RT.WideStore как СУБД
Базовые сведения об RT.WideStore. Архитектура кластера. Кластерный режим
Роль RT.WideStore. в хранилищах. Отличие от RT.WareHouse (Greenplum) и RT.DataLake (Hadoop).
Best practices использования
RT.WideStore. как часть экосистемы TData.
RT.CluscterManager. Развертывание шардированного кластера.
Концепция векторной обработки данных.
Работа с клиентом командной строки. Подключение при помощи внешнего клиента.
02
Хранение и выборка данных
Движки баз данных и их назначение.
Движки таблиц семейства MergeTree. Особенности хранения и антипаттерны, связанные с ним.
Распределенные таблицы. Репликация и шардирование.
Выполнение и оптимизация запросов.
Дополнительные индексы.
Проекции.
Типы данных.
Материализованнные представления.
03
Обработка и модификация данных
Специальные движки таблиц.
Встроенные функции и их модификаторы.
Манипуляции над таблицей и данными. Мутации. Операции с партициями и кусками.
Проблема дубликатов и варианты решения.
Соединения. Словари и JOIN-ы.
04
Взаимодействие с источниками данных
Варианты выгрузки и загрузки данных. Форматы. Паттерны наполнения данными.
Взаимодействие с внешними системами. Движки таблиц для интеграции.
Итоговое тестирование.
05
Итого на курс 40 часов: теория – 20 ч ( 50%), практика – 20 ч ( 50%)
Для кого
Разработчик
Data Engineer
Архитектор ПО
DevOps-инженер
Предварительная подготовка
Базовые знания работы ОС Linux;
Понимание основ работы реляционных баз данных;
Базовые знания SQL (опыт написания запросов из нескольких таблиц);
Знакомство с ETL/ELT процессами.