Машинное обучение на практике
Длительность
24 ак.ч.
Локация
Онлайн
Код
EAS-025
41 900 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей
Описание
Курс построен вокруг нескольких практических кейсов, содержащих таблицы с исходными данными.
По каждому кейсу проходим полный жизненный цикл проекта машинного обучения:
- исследование, очистка и подготовка данных,
- выбор метода обучения, соответствующего задаче (линейная регрессия для регрессии, случайный лес для классификации, К-средние и DBSCAN для кластеризации),
- обучение с использованием выбранного метода,
- оценка результата,
- оптимизация модели,
- представление результата заказчику.
На дискуссионной части курса обсуждаем стоящие перед слушателями практические задачи, которые можно решить рассмотренными методами.
После прохождения курса выдается
удостоверение о повышении квалификации государственного образца
удостоверение о повышении квалификации государственного образца
Цели
- Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование).
- Научиться применять начальные методы машинного обучения и с помощью быстрого прототипирования научиться отвечать на вопрос «оценить реальную прибыль от возможного внедрения».
- Подсветить, какие данные необходимо собирать и что может потребоваться от них в ближайшем будущем. Почему «хотим хранить петабайты» это не всегда просто прихоть.
- Подготовится к более сложным темам, в частности – к полным решениям реальных сложных бизнес-задач.
- Посмотреть, как именно машинное обучение стыкуется с классической аналитикой. В частности, убедиться, что не обязательно (и даже вредно) увольнять всех существующих аналитиков для внедрения концепции.
Целевая аудитория
Основная:
- Аналитики
- Менеджеры проектов, связанных с данными
- Технические лидеры / ведущие разработчики в любых проектах, связанных с данными
- Бизнес-аналитики
- Разработчики
- Инженеры данных (Data Engineer)
- Архитекторы, системные проектировщики
Предварительная подготовка
Умение читать простой код на Python и
писать на любом скриптовом языке.
Разбираемые темы
-
1. Обзор задачи (теория – 1 час)
- Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать.
- Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
-
2. Подготовка, очистка, исследование данных (теория – 1 ч, практика – 1 ч)
- Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок).
- Последовательность обработки.
- Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist.
- Приоритеты решения конкретной задачи.
-
3. Классификаторы и Регрессоры (теория – 2 ч, практика – 2 ч)
- Практический раздел - хорошо формализованные задачи с подготовленными данными.
- Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
- Примеры классификации практических задач.
-
4. Кластеризация (теория – 1 ч, практика – 2 ч)
- Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов.
- Какие случаи можно свести к кластеризации.
-
5. Оценка моделей (теория – 1 ч, практика – 1 ч)
- Бизнес-метрики и технические метрики.
- Метрики для задач классификации и регрессии, матрица ошибок.
- Внутренние и внешние метрики качества кластеризации.
- Кросс-валидация.
- Оценка переобучения.
-
6. Оптимизация (теория – 5 ч, практика – 3 ч)
- Что делает одну модель лучше другой: параметры, признаки, ансамбли.
- Управление параметрами.
- Практика выбора признаков.
- Обзор инструментария для поиска лучших параметров, признаков и методов.
-
7. Графики, отчеты, работа с живыми задачами (теория – 2 ч, практика – 2 ч)
- Как доступно объяснить происходящее: себе, команде, клиенту.
- Более красивые ответы на бессмысленные вопросы.
- Как презентовать три терабайта результатов на одном слайде.
- Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
- От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
-
Всего: теория – 13 ч. (54%), практика – 11 ч. (46%)
Раcписание курсов
Вид:
Регистрируйтесь на следующий курс
Предварительная регистрация гарантирует участие в обучении. Мы обязательно оповестим вас, когда курс будет запланирован
Связанные курсы
Основы машинного обучения
Этот тренинг дает представление об основных группах методов машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Участники узнают, как решать распространенные задачи анализа текстов, прогнозирования цены, выдачи рекомендаций и другие. В практических заданиях много времени уделяется работе с признаками, перебору параметров моделей и построению ансамблей.
Машинное обучение с подкреплением: обычное и глубокое
В этом курсе дается общий обзор метода обучения с подкреплением (Reinforcement Learning, RL). Мы начнем с необходимой математики, рассмотрим базовые алгоритмы RL и поговорим о глубоком обучении с подкреплением (Deep RL), а также о новейших методах машинного обучения, используемых в настоящее время. Мы подробно рассмотрим некоторые применения и расскажем о важнейших достижениях в этой области.