Описание
В рамках курса вы познакомитесь с основными понятиями и задачами, возникающими при создании хранилищ данных. Поймете, как цели влияют на выбор архитектуры и к каким последствиям может привести недостаточное внимание к компонентам. Составите представление о ролях и влиянии участников команды на результат.
В программе курса будут описаны практические подходы к проектированию и внедрению хранилищ данных и его компонент. Вы рассмотрите управление жизненным циклом, включая вывод из эксплуатации и миграцию на новые системы, затронете темы управления данными и построения приложений на их основе.
В практической части слушатели разработают концептуальную и физическую ER-диаграммы хранилища на основании бизнес-требований.удостоверение о повышении квалификации государственного образца
Цели
- Получить представление о роли и задачах хранилища данных в ИТ ландшафте предприятия.
- Освоить все этапы жизненного цикла DWH от проектирования к внедрению, эксплуатации и выведению из сопровождения.
- Научиться избегать типовые ошибки при создании хранилищ и освоить методы и практики для успешного сопровождения хранилищ данных.
- Научиться принимать архитектурные решения на этапе проектирования хранилища.
- Научиться самостоятельно разрабатывать концептуальную и физическую ER-диаграммы хранилища.
Целевая аудитория
- архитекторов;
- технических лидеров и ведущих разработчиков;
- системных аналитиков и проектировщиков;
- владельцев продукта (DWH);
- менеджеров проектов (DWH);
- руководителей отделов (DWH).
Также может быть интересным:
- инженерам по качеству данных (DQ);
- BI-специалистам (BI).
Разбираемые темы
-
1. Введение (теория - 2 ч., практика - 0,4 ч.)
- Понятие «хранилище данных». Его возможности и ограничения.
- Зачем создается DWH, какую бизнес-задачу оно решает.
-
2. Компоненты и архитектура (теория - 2,6 ч., практика - 0,5 ч.)
- Классические подходы к проектированию хранилищ данных.
- Типовые компоненты и протекающие процессы.
- Концепции Инмона, Кимбалла и DataVault.
- Обзор основных компонентов (stage, ods, dds, datamart, bi, metadata) и процессов (ETL, ELT, DQ, lineage).
-
3. Управление данными - Data Governance (теория 1,7 - ч., практика - 0,3 ч.)
- Общие и частные вопросы управления данными предприятия.
- Информация рассматривается как актив, приносящий ценность и имеющий затраты на получение.
- Концепция «мастер-данные» и системы по их управлению – MDM.
-
4. Методики проектирования хранилищ (теория 4 - ч., практика 0,8 ч.)
- Шаги проектирования хранилища.
- Типовые приемы и инструментарий при создании.
- Экспертиза участников и инфраструктуры.
-
5. Область хранения исходных данных - Stage (теория - 2,3 ч., практика - 0,5 ч.)
- Потребность в хранении исходных данных из системы источника.
- Типичные ошибки при организации данной области и ее отличие от «озера данных».
-
6. Области постоянного хранения - ODS и DDS (теория 2,6 - ч., практика 0,5 ч.)
- Слои операционного и многомерного хранения данных.
- Процессы извлечения, очистки, контроля и сохранения - ETL\ELT.
- Трансформация в целевую схему хранения.
-
7. Системы-потребители данных хранилища (теория 3 - ч., практика 0,6 - ч.)
- Типовые сценарии использования данных из хранилищ.
- Основные потребители - системы бизнес-аналитики «BI».
- Устройство типовой БИ системы и причины их большого разнообразия.
-
8. Новые вызовы в развитии хранилищ данных (теория 1,8 - ч., практика - 0,4 ч.)
- Обзор основных проблем, с которыми сталкиваются хранилища при росте.
- Новые вызовы в области машинного обучения.
- Концепция Data Mesh как альтернатива дальнейшего развития.
Руководитель проектов в ИТ области по разработке сервисов на основе BigData. Эксперт в области построения хранилищ данных. Разработчик для СУБД ORACLE. Участвовал во внедрении системы клиент-банк в ВТБ. Создал и эксплуатировал DWH в филиале ПАО МегаФон. Занимался задачами системного анализа и проектирования архитектуры при миграции локальных хранилищ в единое корпоративное хранилище. Нацелен на достижение результата с развитием долговременных отношений в команде.