О чём курс

Курс построен вокруг нескольких практических кейсов, содержащих таблицы с исходными данными.

 По каждому кейсу проходим полный жизненный цикл проекта машинного обучения:
  • исследование, очистка и подготовка данных,
  • выбор метода обучения, соответствующего задаче (линейная регрессия для регрессии, случайный лес для классификации, К-средние и DBSCAN для кластеризации),
  • обучение с использованием выбранного метода,
  • оценка результата,
  • оптимизация модели,
  • представление результата заказчику.

  • На дискуссионной части курса обсуждаем стоящие перед слушателями практические задачи, которые можно решить рассмотренными методами.

    Цели

  • Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование).
  • Научиться применять начальные методы машинного обучения и с помощью быстрого прототипирования научиться отвечать на вопрос «оценить реальную прибыль от возможного внедрения».
  • Подсветить, какие данные необходимо собирать и что может потребоваться от них в ближайшем будущем. Почему «хотим хранить петабайты» это не всегда просто прихоть.
  • Подготовится к более сложным темам, в частности – к полным решениям реальных сложных бизнес-задач.
  • Посмотреть, как именно машинное обучение стыкуется с классической аналитикой. В частности, убедиться, что не обязательно (и даже вредно) увольнять всех существующих аналитиков для внедрения концепции.
  • Целевая аудитория

    Основная:
  • Аналитики
  • Менеджеры проектов, связанных с данными
  • Технические лидеры / ведущие разработчики в любых проектах, связанных с данными
  • Бизнес-аналитики
  • Дополнительная:
  • Разработчики
  • Инженеры данных (Data Engineer)
  • Архитекторы, системные проектировщики
  • Предварительная подготовка

    Умение читать простой код на Python и писать на любом скриптовом языке.

    Для кого

    Data Scientist Data Scientist
    Бизнес-аналитик Бизнес-аналитик
    Разработчик Разработчик
    Data Engineer Data Engineer

    Улучшаемые навыки

    Машинное обучение
    Python
    Scikit-learn
    Pandas
    Seaborn
    Регрессия
    Классификация
    Кластеризация

    Инструменты

    Python Python
    Scikit-learn Scikit-learn
    Pandas Pandas
    Jupyter Notebook Jupyter Notebook
    Seaborn Seaborn

    Программа курса

    01 Обзор задачи
  • Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать.
  • Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
  • 02 Подготовка, очистка, исследование данных
  • Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок).
  • Последовательность обработки.
  • Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist.
  • Приоритеты решения конкретной задачи.
  • 03 Классификаторы и Регрессоры
  • Практический раздел - хорошо формализованные задачи с подготовленными данными.
  • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
  • Примеры классификации практических задач.
  • 04 Кластеризация
  • Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов.
  • Какие случаи можно свести к кластеризации.
  • 05 Оценка моделей
  • Бизнес-метрики и технические метрики.
  • Метрики для задач классификации и регрессии, матрица ошибок.
  • Внутренние и внешние метрики качества кластеризации.
  • Кросс-валидация.
  • Оценка переобучения.
  • 06 Оптимизация
  • Что делает одну модель лучше другой: параметры, признаки, ансамбли.
  • Управление параметрами.
  • Практика выбора признаков.
  • Обзор инструментария для поиска лучших параметров, признаков и методов.
  • 07 Графики, отчеты, работа с живыми задачами
  • Как доступно объяснить происходящее: себе, команде, клиенту.
  • Более красивые ответы на бессмысленные вопросы.
  • Как презентовать три терабайта результатов на одном слайде.
  • Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
  • От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
  • 08 Всего: теория – 13 ч. (54%), практика – 11 ч. (46%)

    39 000 ₽

    35 100 ₽ — для физ. лиц

    Записаться на курс

    Чему вы научитесь

    01 Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование)
    02 Подготавливать и очищать данные для анализа.
    03 Выбирать и применять методы машинного обучения для решения задач классификации, регрессии и кластеризации.
    04 Оценивать качество моделей и оптимизировать их параметры.
    05 Визуализировать и представлять результаты анализа заказчику.
    06 Создавать простые и ансамблевые модели для предсказаний и обнаружения структур в данных.

    39 000 ₽

    35 100 ₽ — для физ. лиц

    Записаться на курс

    Записаться на курс

    39 000 ₽

    35 100 ₽ — для физ. лиц

    Юр. лицо — 39 000 ₽
    Физ. лицо — 35 100 ₽
    Открытая дата

    Связанные курсы

    EAS-020
    24 часа

    Основы машинного обучения

    Основы машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Курс дает представление об основных группах методов машинного обучения и их применении для решения задач анализа текстов, прогнозирования цены и выдачи рекомендаций. В практической части курса участники будут работать с признаками, перебирать параметры моделей и строить ансамбли, используя язык Python.

    от Middle

    32 000 ₽

    EAS-027
    30 часов

    Машинное обучение с подкреплением: обычное и глубокое

    Освойте методы обучения с подкреплением и их применение в реальных задачах. Этот курс предоставляет всесторонний обзор RL и DRL, включая основы математики, базовые алгоритмы и современные исследования. Вы научитесь моделировать среды RL и применять алгоритмы для решения

    от Senior

    54 500 ₽

    Наши ученики работают в:

    Наши клиенты

    Mail.ru
    Альфа-Банк, банковская группа
    Лаборатория Касперского
    Магнит, розничная сеть
    Спортмастер, сеть спортивных магазинов
    ПСБ
    Сбертех
    Дзен
    IT One
    Ростелеком
    Мегафон
    Nexign
    Ozon
    Декатлон
    X5 Group
    Технониколь
    Росатом
    Газпром
    Нлмк
    ВСК
    Синимекс

    Не нашли, что искали? — Просто напишите, и мы поможем

    Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
    Пользователь только что записался на курс ""
    Спасибо!
    Форма отправлена успешно.