Современные методы управления данными (BigData, ML)

В данной программе собраны курсы по различным подходам к крупномасштабному хранению и обработке данных – как с использованием традиционных хранилищ данных, так и на основе современных распределенных систем. Курсы адресованы разработчикам Big Data. В собранных тренингах рассматриваются различные инструменты управления данными: MongoDB, Cassandra, Hadoop, Spark, Hive, Impala.
BI-001
В курсе рассматриваются особенности создания и изменения отчетов путем подготовки и визуализации информации для бизнес-пользователей.
BI-002
Тренинг по основам работы с Business Intelligence (BI) платформой Tableau поможет развить базовые навыки анализа и визуализации данных для слушателей с начальным уровнем аналитической подготовки. Главная отличительная особенность Tableau – интуитивность, а также отсутствие строгих требований к техническому опыту перед началом работы, и начинать знакомство можно практически с нуля. Анализ данных уже, пожалуй, невозможен без правильных инструментов. Tableau – одно из лучших решений в этой области, признанный лидер в теме информационного дизайна и автоматизации отчётности. В ходе тренинга слушатели познакомятся с теоретическими основами анализа данных и BI, а также на практике научатся работать с различными источниками данных, включая MS Excel, анализировать пригодность данных для работы, строить выгружаемые отчёты, отдельные визуализации и аналитические дашборды – интерактивные информационные дашборды для автоматизации рутинных рабочих задач.
BI-003
Тренинг для продолжающих работы в области с Business Intelligence (BI) платформой Tableau нацелен на развитие продвинутых навыков анализа и визуализации данных, а также автоматизации отчётности и построения компактных, понятных и интерактивных дашбордов, представляющих информацию дозированно и красиво. Во время тренинга слушатели познакомятся с расширенным инструментарием для аналитической работы в Tableau, узнают о секретных техниках и лайфхаках, попробуют свои силы в разработке дашбордов со сложной логикой под капотом, научатся обходить ограничения источников данных и подробнее познакомятся с тем, как Tableau работает с точки зрения производительности и скорости. Тема продвинутого информационного дизайна также занимает отдельное место в структуре курса, и ей будет отдано особое внимание.
EAS-004
Курс дает представление о подходах к проектированию хранилищ данных и их использованию в гетерогенных информационных системах предприятий. Вы рассмотрите вопросы выбора архитектуры, методов внедрения и сопровождения хранилищ данных.
EAS-011
Этот курс представляет обзор современных способов хранения данных, в том числе хранилищ ключ-значение, документно-ориентированных и потоковых систем управления базами данных, систем распределенного хранения и обработки данных.
EAS-014
В курсе изучаются основы архитектуры Cassandra 3.x , разработка концептуальных, логических и физических моделей данных. Рассматриваются все необходимые технические подробности для использования Cassandra для масштабируемого хранения данных в проектах на Java, а также для мониторинга, конфигурирования и настройки производительности.
EAS-015
24 часа
Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластере и сопутствующими проектами, входящими в экосистему Hadoop: Hive, Spark, HBase.
EAS-017
Курс дает представление об основах Apache Spark и методах разработки приложений, обрабатывающих данные на его основе. Рассматриваются как базовые возможности Spark (RDD), так и проекты, расширяющие их набор: Spark SQL, Spark Streaming, MLLib, Spark ML, GraphX.
EAS-018
Курс дает представление об основах СУБД MongoDB и методах разработки приложений, хранящих и обрабатывающих данные на его основе. Рассматриваются базовые возможности сохранения, извлечения и поиска документов (CRUD), способы формирования поисковых запросов, в том числе с использованием конвейеров Aggregation Framework и Map/Reduce.
EAS-020
На курсе дается представление об основных группах методов машинного обучения: классификации, предсказании, кластеризации, ансамблях, рекомендационных системах, глубоком обучении.
EAS-022
Курс дает представление об основах колоночной системы управления базами данных Apache HBase и методах разработки приложений, обрабатывающих данные на ее основе.
EAS-024
Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL и Spark Streaming.
EAS-025
Вводный практический курс по машинному обучению. Рассматривается полный цикл построения решения: от выделения исходных данных («.xlsx файл») через построение модели и до объяснения конечному заказчику особенностей данных и специфики полученного результата. Теоретические разделы - классификация, регрессия, предсказания, ансамбли – даются в обзорном режиме, в объёме, необходимом для корректного построения и понимания разбираемых примеров.
EAS-026
24 часа
Вводный тренинг по Apache Kafka – платформе распределенной потоковой передачи событий с открытым исходным кодом. Рассматриваются архитектурные особенности Kafka, обеспечивающие высокопроизводительную доставку данных.
EAS-027
В этом курсе дается общий обзор метода обучения с подкреплением (Reinforcement Learning, RL). Мы начнем с необходимой математики, рассмотрим базовые алгоритмы RL и поговорим о глубоком обучении с подкреплением (Deep RL), а также о новейших методах машинного обучения, используемых в настоящее время. Мы подробно рассмотрим некоторые применения и расскажем о важнейших достижениях в этой области.
Ищете нестандартное решение?
Наши эксперты помогут!
Спасибо.
Ваш запрос был получен.
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.