Улучшаемые навыки

Машинное обучение
Python
Scikit-learn
Pandas
Seaborn
Регрессия
Классификация
Кластеризация

Инструменты

Python Python
Scikit-learn Scikit-learn
Pandas Pandas
Jupyter Notebook Jupyter Notebook
Seaborn Seaborn

Чему вы научитесь

01 Понять, какие задачи можно решать машинным обучением (и узнать, что Big Data это всего лишь подраздел, а не обязательное требование)
02 Подготавливать и очищать данные для анализа.
03 Выбирать и применять методы машинного обучения для решения задач классификации, регрессии и кластеризации.
04 Оценивать качество моделей и оптимизировать их параметры.
05 Визуализировать и представлять результаты анализа заказчику.
06 Создавать простые и ансамблевые модели для предсказаний и обнаружения структур в данных.

Программа курса

01 Обзор задачи
  • Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать.
  • Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
  • 02 Подготовка, очистка, исследование данных
  • Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок).
  • Последовательность обработки.
  • Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist.
  • Приоритеты решения конкретной задачи.
  • 03 Классификаторы и Регрессоры
  • Практический раздел - хорошо формализованные задачи с подготовленными данными.
  • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
  • Примеры классификации практических задач.
  • 04 Кластеризация
  • Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов.
  • Какие случаи можно свести к кластеризации.
  • 05 Оценка моделей
  • Бизнес-метрики и технические метрики.
  • Метрики для задач классификации и регрессии, матрица ошибок.
  • Внутренние и внешние метрики качества кластеризации.
  • Кросс-валидация.
  • Оценка переобучения.
  • 06 Оптимизация
  • Что делает одну модель лучше другой: параметры, признаки, ансамбли.
  • Управление параметрами.
  • Практика выбора признаков.
  • Обзор инструментария для поиска лучших параметров, признаков и методов.
  • 07 Графики, отчеты, работа с живыми задачами
  • Как доступно объяснить происходящее: себе, команде, клиенту.
  • Более красивые ответы на бессмысленные вопросы.
  • Как презентовать три терабайта результатов на одном слайде.
  • Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
  • От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
  • 08 Всего: теория – 13 ч. (54%), практика – 11 ч. (46%)

    40 900 ₽

    36 810 ₽ — для физ. лиц

    Записаться на курс

    Для кого

    Data Scientist Data Scientist
    Бизнес-аналитик Бизнес-аналитик
    Разработчик Разработчик
    Data Engineer Data Engineer

    Предварительная подготовка

    Умение читать простой код на Python и писать на любом скриптовом языке.

    40 900 ₽

    36 810 ₽ — для физ. лиц

    Записаться на курс

    Записаться на курс

    40 900 ₽

    36 810 ₽ — для физ. лиц

    Юр. лицо — 40 900 ₽
    Физ. лицо — 36 810 ₽
    Открытая дата

    Наши ученики работают в:

    Наши клиенты

    Mail.ru
    Альфа-Банк, банковская группа
    Лаборатория Касперского
    Магнит, розничная сеть
    Спортмастер, сеть спортивных магазинов
    ПСБ
    Сбертех
    Дзен
    IT One
    Ростелеком
    Мегафон
    Nexign
    Ozon
    Декатлон
    X5 Group
    Технониколь
    Росатом
    Газпром
    Нлмк
    ВСК
    Синимекс

    Связанные курсы

    EAS-020
    24 часа

    Основы машинного обучения

    Основы машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Курс дает представление об основных группах методов машинного обучения и их применении для решения задач анализа текстов, прогнозирования цены и выдачи рекомендаций. В практической части курса участники будут работать с признаками, перебирать параметры моделей и строить ансамбли, используя язык Python.

    от Middle

    33 600 ₽

    EAS-027
    30 часов

    Машинное обучение с подкреплением: обычное и глубокое

    Освойте методы обучения с подкреплением и их применение в реальных задачах. Этот курс предоставляет всесторонний обзор RL и DRL, включая основы математики, базовые алгоритмы и современные исследования. Вы научитесь моделировать среды RL и применять алгоритмы для решения

    от Senior

    57 200 ₽

    Не нашли, что искали? — Просто напишите, и мы поможем

    Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
    Пользователь только что записался на курс ""
    Спасибо!
    Форма отправлена успешно.