Улучшаемые навыки

Машинное обучение
Обучение с подкреплением
Глубокое обучение
Python
Q-обучение
Градиентные методы
Pytorch
Ray
Numpy
Matplotlib
Gym
Pygame

Инструменты

Python Python
NumPy NumPy
Pytorch Pytorch
Matplotlib Matplotlib

Чему вы научитесь

01 Понимать основные концепции обучения с подкреплением (RL) и глубокого обучения с подкреплением (DRL).
02 Применять базовые и продвинутые алгоритмы RL для решения реальных задач.
03 Визуализировать и адаптировать алгоритмы RL.
04 Разрабатывать и оптимизировать модели RL с использованием нейронных сетей.
05 Использовать инструменты Pytorch и Ray для реализации и тестирования RL-алгоритмов.

Программа курса

01 Часть I. Предыстория
1. Линейная алгебра
  • Обзор основных концепций

  • 2.Математический анализ
  • Интегралы
  • Производные
  • Примеры

  • 3. Теория вероятностей
  • Случайные величины
  • Функции плотности вероятности
  • Математическое ожидание
  • Условные, совместные и безусловные вероятности
  • Примеры. Практика
  • 02 Часть II. Обзор
    1. Введение в RL 
  • Марковские процессы принятия решений
  • Динамическое программирование с примером
  • Уравнение Беллмана
  • Оценка стратегии
  • Итерация по стратегиям
  • Итерация по ценностям
  • Примеры
  • Практика

  • 2. На основе модели и без модели
  • Обучение и планирование
  • Детерминированное
  • Стохастическое
  • Аппроксимация линейной функции-значения
  • Сравнение и практика

  • 3. Алгоритмы
  • Q-обучение
  • SARSA
  • Методы Исполнитель-критик
  • Градиент стратегии
  • Методы дерева Монте-Карло
  • Обучение и исполнение
  • Примеры
  • Практика
  • 03 Часть III. RL + глубокое обучение
    1. Глубокое обучение с подкреплением
  • Аппроксимация нелинейной функции
  • Прорыв DeepMind
  • Объяснение Alpha-Star

  • 2. Новейшие технологии в глубоком RL
  • Память, внимание, рекурсия
  • Обратное RL
  • Обучение нескольких агентов
  • Иерархическое обучение
  • Развитие поощрений – AutoRL
  • Оптимизации стратегий

  • 3. Применения и использование
  • Трейдинг
  • Понимание речи и вопросно-ответные системы (опционально)
  • Балансировка нагрузки (опционально)
  • Другие применения (опционально)
  • 04 Часть IV. Практические примеры и инструменты
    1. Pytorch / Tensorflow
  • Основы тензорного исчисления
  • Реализация алгоритма RL с нуля
  • Тестирование и визуализация
  • Практика

  • 2. Ray + RLlib
  • Основные понятия: исполнители, модели будущего, совместное использование памяти и т.д.
  • Пример с решением
  • Различные алгоритмы
  • Сеточный поиск и визуализация
  • Практика

  • 3. Визуализация и объяснимость
  • SMDP, AMDP, SAMDP
  • Проекция на 3D-пространство с помощью TSNE
  • Примеры
  • 57 200 ₽

    51 480 ₽ — для физ. лиц

    Записаться на курс

    Для кого

    Data Engineer Data Engineer
    ML Engineer ML Engineer
    Разработчик Разработчик

    Предварительная подготовка

    Необходимая подготовка:
  • Вузовская программа по математическому анализу, теории вероятностей, дискретной математике
  • Базовые знания в области машинного обучения
  • Понимание кода на языке Python
  • 57 200 ₽

    51 480 ₽ — для физ. лиц

    Записаться на курс

    Записаться на курс

    57 200 ₽

    51 480 ₽ — для физ. лиц

    Юр. лицо — 57 200 ₽
    Физ. лицо — 51 480 ₽
    Открытая дата

    Наши ученики работают в:

    Наши клиенты

    Mail.ru
    Альфа-Банк, банковская группа
    Лаборатория Касперского
    Магнит, розничная сеть
    Спортмастер, сеть спортивных магазинов
    ПСБ
    Сбертех
    Дзен
    IT One
    Ростелеком
    Мегафон
    Nexign
    Ozon
    Декатлон
    X5 Group
    Технониколь
    Росатом
    Газпром
    Нлмк
    ВСК
    Синимекс

    Связанные курсы

    EAS-020
    24 часа

    Основы машинного обучения

    Основы машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Курс дает представление об основных группах методов машинного обучения и их применении для решения задач анализа текстов, прогнозирования цены и выдачи рекомендаций. В практической части курса участники будут работать с признаками, перебирать параметры моделей и строить ансамбли, используя язык Python.

    от Middle

    33 600 ₽

    EAS-025
    24 часа

    Машинное обучение на практике

    Практический курс по машинному обучению для аналитиков и разработчиков. Освоите полный цикл создания ML-моделей от подготовки данных до презентации результатов. Уникальность: курс построен на реальных кейсах, что позволяет сразу применять знания на практике. Ценность: научитесь решать реальные бизнес-задачи с помощью машинного обучения, повышая эффективность и точность решений.

    от Middle

    40 900 ₽

    Не нашли, что искали? — Просто напишите, и мы поможем

    Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
    Пользователь только что записался на курс ""
    Спасибо!
    Форма отправлена успешно.