Современные методы управления данными (BigData, ML)

В данной программе собраны курсы по различным подходам к крупномасштабному хранению и обработке данных – как с использованием традиционных хранилищ данных, так и на основе современных распределенных систем. Курсы адресованы разработчикам Big Data. В собранных тренингах рассматриваются различные инструменты управления данными: MongoDB, Cassandra, Hadoop, Spark, Hive, Impala.

Выберите уровень

часов
BI-001 Junior
В курсе рассматриваются особенности создания и изменения отчетов путем подготовки и визуализации информации для бизнес-пользователей.
BI-002 Middle
Тренинг по основам работы с Business Intelligence (BI) платформой Tableau поможет развить базовые навыки анализа и визуализации данных для слушателей с начальным уровнем аналитической подготовки. Главная отличительная особенность Tableau – интуитивность, а также отсутствие строгих требований к техническому опыту перед началом работы, и начинать знакомство можно практически с нуля. Анализ данных уже, пожалуй, невозможен без правильных инструментов. Tableau – одно из лучших решений в этой области, признанный лидер в теме информационного дизайна и автоматизации отчётности. В ходе тренинга слушатели познакомятся с теоретическими основами анализа данных и BI, а также на практике научатся работать с различными источниками данных, включая MS Excel, анализировать пригодность данных для работы, строить выгружаемые отчёты, отдельные визуализации и аналитические дашборды – интерактивные информационные дашборды для автоматизации рутинных рабочих задач.
BI-003 Senior
Тренинг для продолжающих работы в области с Business Intelligence (BI) платформой Tableau нацелен на развитие продвинутых навыков анализа и визуализации данных, а также автоматизации отчётности и построения компактных, понятных и интерактивных дашбордов, представляющих информацию дозированно и красиво. Во время тренинга слушатели познакомятся с расширенным инструментарием для аналитической работы в Tableau, узнают о секретных техниках и лайфхаках, попробуют свои силы в разработке дашбордов со сложной логикой под капотом, научатся обходить ограничения источников данных и подробнее познакомятся с тем, как Tableau работает с точки зрения производительности и скорости. Тема продвинутого информационного дизайна также занимает отдельное место в структуре курса, и ей будет отдано особое внимание.
EAS-004 Middle
Курс дает представление о подходах к проектированию хранилищ данных и их использованию в гетерогенных информационных системах предприятий. Вы рассмотрите вопросы выбора архитектуры, методов внедрения и сопровождения хранилищ данных.
EAS-011 Junior
Этот курс представляет обзор современных способов хранения данных, в том числе хранилищ ключ-значение, документно-ориентированных и потоковых систем управления базами данных, систем распределенного хранения и обработки данных.
EAS-014 Middle
В курсе изучаются основы архитектуры Cassandra 4-x, разработка концептуальных, логических и физических моделей данных. Рассматриваются все необходимые технические подробности для использования Cassandra для масштабируемого хранения данных в проектах на Java, а также для мониторинга, конфигурирования и настройки производительности.
EAS-015 Middle
24 часа
Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных фреймворком YARN, управляющим параллельным выполнением приложений на кластере и сопутствующими проектами, входящими в экосистему Hadoop: Hive, Spark, HBase.
EAS-016 Middle
8 часов
В курсе изучаются основы архитектуры Hive , разработка скриптов по загрузке, трансформации и выгрузке данных. Рассматриваются все необходимые технические подробности. Конфигурирование и настройки производительности.
EAS-017 Middle
Этот тренинг дает представление об основных понятиях фреймворка Apache Spark и методах его использования для разработки приложений, обрабатывающих данные. Мы рассмотрим применение этого фреймворка для автоматической генерации кода и его распределенного выполнения. Слушатели научатся работать с файлами данных в различных форматах (CSV, Json, Avro, Parquet) в приложениях на Spark, используя SQL и DataFrame. Кроме того, речь пойдет о загрузке данных с внешних хранилищ и во внешние хранилища, такие как Cassandra, Kafka, Postgres и S3. Практические упражнения выполняются на языке Python с использованием веб-ноутбуков Jupyter.
EAS-018 Middle
Курс дает представление об основах СУБД MongoDB и методах разработки приложений, хранящих и обрабатывающих данные на его основе. Рассматриваются базовые возможности сохранения, извлечения и поиска документов (CRUD), способы формирования поисковых запросов, в том числе с использованием конвейеров Aggregation Framework и Map/Reduce.
EAS-019 Middle
8 часов
В ходе курса вы получите глубокое понимание Apache Impala и его возможностей для обработки и анализа данных. Вы изучите роль и компоненты кластера Impala, типы данных, запросы на выборку, загрузку данных и пользовательские функции UDF, а также сравнение Impala и Hive.
EAS-020 Middle
Этот тренинг дает представление об основных группах методов машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Участники узнают, как решать распространенные задачи анализа текстов, прогнозирования цены, выдачи рекомендаций и другие. В практических заданиях много времени уделяется работе с признаками, перебору параметров моделей и построению ансамблей.
EAS-022 Middle
Курс дает представление об основах колоночной системы управления базами данных Apache HBase и методах разработки приложений, обрабатывающих данные на ее основе.
EAS-024 Senior
Тренинг даёт подробное представление о внутреннем устройстве и функционировании фреймворка Apache Spark – как Spark Core (RDD), так и Spark SQL и Spark Streaming.
EAS-025 Middle
Вводный практический курс по машинному обучению. Рассматривается полный цикл построения решения: от выделения исходных данных («.xlsx файл») через построение модели и до объяснения конечному заказчику особенностей данных и специфики полученного результата. Теоретические разделы - классификация, регрессия, предсказания, ансамбли – даются в обзорном режиме, в объёме, необходимом для корректного построения и понимания разбираемых примеров.
EAS-026 Middle
24 часа
Вводный тренинг по Apache Kafka – платформе распределенной потоковой передачи событий с открытым исходным кодом. Рассматриваются архитектурные особенности Kafka, обеспечивающие высокопроизводительную доставку данных.
EAS-027 Senior
В этом курсе дается общий обзор метода обучения с подкреплением (Reinforcement Learning, RL). Мы начнем с необходимой математики, рассмотрим базовые алгоритмы RL и поговорим о глубоком обучении с подкреплением (Deep RL), а также о новейших методах машинного обучения, используемых в настоящее время. Мы подробно рассмотрим некоторые применения и расскажем о важнейших достижениях в этой области.
EAS-028 Middle
Практический курс по обработке текстов методами машинного обучения. Участники узнают и разберутся с тем, для каких задач применяется машинное обучение, как правильно ставить задачи, собирать и готовить данные, как работать с признаками, как оценивать качество результата. В курсе рассмотрены различные методы предобработки текстов, векторные представления слов и их использование для классификации и других задач. Участники изучат методы разметки текстов, извлечения именованных сущностей и снижения размерности. Отдельное внимание будет уделено предобученным языковым моделям, таким как BERT и GPT, и их применению для работы с текстовыми данными.
EAS-029 Middle
Курс предназначен для приобретения знаний и навыков в области глубокого обучения для работы с нейросетями. Курс детально разбирает нейросетевые архитектуры и практические способы создания моделей для классификации, обнаружения, сегментации и локализации объектов, генерации изображений и текстов, в т.ч. с применением предобученных сетей с их последующим дообучением и тонкой настройкой под конкретные предметные области.
EAS-030 Senior
30 часов
На тренинге вы углубите свои базовые знания об Apache Kafka: узнаете архитектуру Kafka, устройство Producer и Consumer, надежную доставку сообщений, использование Kafka Connect, Kafka Streams и ksqlDB. Помимо теоретических знаний вы получите практические навыки, которые помогут применить полученные знания в своей работе.
EAS-032 Middle
Курс направлен на развитие компетенций по созданию, выполнению, мониторингу и оркестрации потоков операций по обработке данных с использованием Apache AirFlow.
EAS-033 Middle
Эффективное применение ClickHouse для обработки большого количества данных.
Ищете нестандартное решение?
Наши эксперты помогут!
Спасибо.
Ваш запрос был получен.
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.