О чём курс
Классическое компактное введение в машинное обучение. Без излишнего теоретизирования, только основные принципы, подходы и важные тонкости. На самом деле, конечно, без математического анализа и теории вероятностей обойтись не получится, но мы возьмем только самый минимум.
Самое важное, чему мы учим на тренинге – пониманию, что все машинное обучение на практике – это выбор (или перебор) подходящего вида модели – регрессия, дерево, ансамбль или нейронная сеть, а дальше в дело вступает более или менее оптимизированный подбор параметров – значений коэффициентов в уравнении регрессии, условий для узлов дерева, весов для нейронов.
Теоретическая часть тренинга показывает путь к осознанному выбору подходящей для вашей задачи; модели (хотя в большинстве случаев выбор сегодня между ансамблями типа XGBoost и нейронными сетями). А дальше – практика в ноутбуках с обучением разных моделей, чтобы самостоятельно увидеть и почувствовать что и когда хорошо применять. Используем фреймворк Scikit-learn.
Цели
Понимать ключевые концепции машинного обучения и его отличия от других методов искусственного интеллекта;
Распознавать виды задач, решаемых методами машинного обучения, и выбирать подходящие методы;
Уметь оценивать построенные модели;
Уметь подготавливать входные данные и интерпретировать результаты, выдаваемые моделями;
Использовать готовые реализации методов машинного обучения.
Целевая аудитория
Разработчики, аналитики, руководители разработки.
Предварительная подготовка
Базовые навыки программирования на Python
Умение работать в командной оболочке Unix/Linux (bash)
Базовые знания математической статистики и теории вероятностей
Для кого
Разработчик
Big Data Analyst
Расписание курсов
Программа курса
01
Виды задач машинного обучения
Что такое машинное обучение
Виды моделей машинного обучения
Этапы машинного обучения
Типовые задачи
Компоненты решений задач
02
Библиотеки для машинного обучения
NumPy, Pandas, SciPy, Matplotlib, Scikit-learn, Tensorflow
Оценка моделей
Функции потерь
Виды метрик
Разбиение на выборки: обучающую, тестовую, проверочную
04
Линейные методы для регрессии и классификации
Линейная регрессия
Логистическая регрессия
Оптимизация: градиентный спуск
Деревья решений
Ансамбли: бустинг, бэггинг (случайный лес)
Разновидности методов
Оценка качества кластеризации
K-means
DBSCAN
Зачем снижать размерность
Методы отбора признаков
Методы конструирования признаков
Выявление аномалий
Нейросетевой подход в машинном обучении
Популярные типы задач, решаемые нейронными сетями
Устройство нейронных сетей
Курс проводят
Петрова Яна
Специалист в области машинного обучения