Описание
Классическое компактное введение в машинное обучение. Без излишнего теоретизирования, только основные принципы, подходы и важные тонкости. На самом деле, конечно, без математического анализа и теории вероятностей обойтись не получится, но мы возьмем только самый минимум.
Самое важное, чему мы учим на тренинге - пониманию, что все машинное обучение на практике – это выбор (или перебор) подходящего вида модели – регрессия, дерево, ансамбль или нейронная сеть, а дальше в дело вступает более или менее оптимизированный подбор параметров – значений коэффициентов в уравнении регрессии, условий для узлов дерева, весов для нейронов.

удостоверение о повышении квалификации государственного образца
Цели
- Понимать ключевые концепции машинного обучения и его отличия от других методов искусственного интеллекта;
- Распознавать виды задач, решаемых методами машинного обучения, и выбирать подходящие методы;
- Уметь оценивать построенные модели;
- Уметь подготавливать входные данные и интерпретировать результаты, выдаваемые моделями;
- Использовать готовые реализации методов машинного обучения.
Целевая аудитория
Предварительная подготовка
- Базовые навыки программирования на Scala, Java или Python;
- умение работать в командной оболочке Unix/Linux (bash);
- базовые знания математической статистики и теории вероятностей.
Разбираемые темы
-
1. Виды задач машинного обучения (теория – 1 ч.)
- Примеры задач с учителем/без учителя/с подкреплением;
- Типовые задачи: прогноз продаж, производства, спроса, анализ поведения, распознавание образов.
-
2. Библиотеки для машинного обучения (теория – 1 ч., практика – 2 ч.)
- NumPy, Pandas, SciPy, Matplotlib, Scikit-learn, Tensorflow.
-
3. Выборки и валидация (теория – 1 ч., практика – 3 ч.)
- Виды входных данных: табличные, тексты, звук, изображения, видео;
- Виды выходных данных;
- Оценка моделей;
- Функции потерь для разных классов задач;
- Виды метрик;
- Признаки и работа с ними: отбор, дискретизация, много классов в один, нормализация, сэмплинг, очистка;
- Разбиение на выборки: обучающую, тестовую, проверочную.
-
4. Методы регрессии (теория – 1 ч., практика – 2 ч.)
- Линейная регрессия;
- CART.
-
5. Деревья (теория – 1 ч., практика – 2 ч.)
- Деревья решений;
- Логистическая регрессия.
-
6. Методы кластеризации (теория – 1 ч., практика – 2 ч.)
- Иерархические;
- Спектральные;
- K-means;
- DBSCAN.
-
7. Снижение размерности (теория – 1 ч., практика – 2 ч.)
- Отбор признаков;
- Конструирование признаков.
-
8. Нейронные сети (теория – 1 ч., практика – 3 ч.)
- Типы нейронных сетей;
- Модель нейрона;
- Многослойные нейронные сети;
- Обратное распространение ошибки;
- Многоклассовая классификация;
- Обучение нейронных сетей;
- Регуляризация в нейронных сетях;
- Batch Normalization, Dropout, Аугментация данных.
-
Всего: теория – 8 ч. (33%), практика – 16 ч. (67%)