Машинное обучение на практике
Вводный практический курс по машинному обучению. Рассматривается полный цикл построения решения: от выделения исходных данных («.xlsx файл») через построение модели и до объяснения конечному заказчику особенностей данных и специфики полученного результата. Теоретические разделы - классификация, регрессия, предсказания, ансамбли – даются в обзорном режиме, в объёме, необходимом для корректного построения и понимания разбираемых примеров.
24 ак.ч.
Онлайн
EAS-025
Машинное обучение на практике
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-025
Расписание и цены
41 900 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей
Машинное обучение на практике
Записаться на курс
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-025
Расписание и цены
41 900 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей

Описание

Курс построен вокруг нескольких практических кейсов, содержащих таблицы с исходными данными.

По каждому кейсу проходим полный жизненный цикл проекта машинного обучения:

  • исследование, очистка и подготовка данных,
  • выбор метода обучения, соответствующего задаче (линейная регрессия для регрессии, случайный лес для классификации, К-средние и DBSCAN для кластеризации),
  • обучение с использованием выбранного метода,
  • оценка результата,
  • оптимизация модели,
  • представление результата заказчику.

На дискуссионной части курса обсуждаем стоящие перед слушателями практические задачи, которые можно решить рассмотренными методами.

Цели

  • Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование).
  • Научиться применять начальные методы машинного обучения и с помощью быстрого прототипирования научиться отвечать на вопрос «оценить реальную прибыль от возможного внедрения».
  • Подсветить, какие данные необходимо собирать и что может потребоваться от них в ближайшем будущем. Почему «хотим хранить петабайты» это не всегда просто прихоть.
  • Подготовится к более сложным темам, в частности – к полным решениям реальных сложных бизнес-задач.
  • Посмотреть, как именно машинное обучение стыкуется с классической аналитикой. В частности, убедиться, что не обязательно (и даже вредно) увольнять всех существующих аналитиков для внедрения концепции.

Целевая аудитория

Основная:
  • Аналитики
  • Менеджеры проектов, связанных с данными
  • Технические лидеры / ведущие разработчики в любых проектах, связанных с данными
  • Бизнес-аналитики
Дополнительная:
  • Разработчики
  • Инженеры данных (Data Engineer)
  • Архитекторы, системные проектировщики

Предварительная подготовка

Умение читать простой код на Python и писать на любом скриптовом языке.

Разбираемые темы

  • 1. Обзор задачи (теория – 1 час)

    • Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать.
    • Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
  • 2. Подготовка, очистка, исследование данных (теория – 1 ч, практика – 1 ч)

    • Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок).
    • Последовательность обработки.
    • Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist.
    • Приоритеты решения конкретной задачи.
  • 3. Классификаторы и Регрессоры (теория – 2 ч, практика – 2 ч)

    • Практический раздел - хорошо формализованные задачи с подготовленными данными.
    • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
    • Примеры классификации практических задач.
  • 4. Кластеризация (теория – 1 ч, практика – 2 ч)

    • Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов.
    • Какие случаи можно свести к кластеризации.
  • 5. Оценка моделей (теория – 1 ч, практика – 1 ч)

    • Бизнес-метрики и технические метрики.
    • Метрики для задач классификации и регрессии, матрица ошибок.
    • Внутренние и внешние метрики качества кластеризации.
    • Кросс-валидация.
    • Оценка переобучения.
  • 6. Оптимизация (теория – 5 ч, практика – 3 ч)

    • Что делает одну модель лучше другой: параметры, признаки, ансамбли.
    • Управление параметрами.
    • Практика выбора признаков.
    • Обзор инструментария для поиска лучших параметров, признаков и методов.
  • 7. Графики, отчеты, работа с живыми задачами (теория – 2 ч, практика – 2 ч)

    • Как доступно объяснить происходящее: себе, команде, клиенту.
    • Более красивые ответы на бессмысленные вопросы.
    • Как презентовать три терабайта результатов на одном слайде.
    • Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
    • От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
  • Всего: теория – 13 ч. (54%), практика – 11 ч. (46%)

  • Развернуть программу
Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
+
Связанные курсы
Основы машинного обучения
Этот тренинг дает представление об основных группах методов машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Участники узнают, как решать распространенные задачи анализа текстов, прогнозирования цены, выдачи рекомендаций и другие. В практических заданиях много времени уделяется работе с признаками, перебору параметров моделей и построению ансамблей.
Машинное обучение с подкреплением: обычное и глубокое
В этом курсе дается общий обзор метода обучения с подкреплением (Reinforcement Learning, RL). Мы начнем с необходимой математики, рассмотрим базовые алгоритмы RL и поговорим о глубоком обучении с подкреплением (Deep RL), а также о новейших методах машинного обучения, используемых в настоящее время. Мы подробно рассмотрим некоторые применения и расскажем о важнейших достижениях в этой области.
Смотреть каталог
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.