EAS-028

Машинное обучение для анализа естественного языка (NLP)

Научитесь применять машинное обучение для анализа текстов и решения реальных задач NLP. Курс сочетает теорию и практику: от предобработки текстов до работы с BERT и GPT. Освойте современные методы обработки естественного языка (NLP) и научитесь применять их в проектах. Уникальность — акцент на практику с использованием Python и предобученных моделей. Тренинг по обработке естественного языка с помощью машинного обучения предназначен для тех, кто хочет познакомиться со сложными методами обработки текстовых данных. Он включает в себя необходимый минимум теории и большой объем практических занятий, позволяющих участникам овладеть необходимыми навыками для работы в области анализа данных. К каждому модулю предлагаются задания для самостоятельного выполнения - домашние работы. В рамках тренинга участники изучат методы преобразования текстовых данных, такие как стемминг, лемматизация и векторизация, а также базовые задачи, которые могут быть решены с помощью методов машинного обучения, такие как классификация, суммаризация текстов, выделение имен и другие. Будет уделено особое внимание практическому применению методов машинного обучения на языке Python с использованием современных нейросетей, таких как FastText, BERT и GPT-2.

Удостоверение о прохождении

Смотреть пример

24 академ. часов

Онлайн

Подробнее

42 900 ₽

38 610 ₽ — для физ. лиц

Записаться на курс

Улучшаемые навыки

Machine Learning

Natural Language Processing

Data Science

Машинное Обучение

Анализ текстов

Обработка текстов

Языковые модели

Эмбеддинги

Нейронные сети

Инструменты

Python

Scikit-learn

TensorFlow

Чему вы научитесь

01 Применять основы машинного обучения и обработки текстов на практике.

02 Использовать методы предобработки текстов и извлечения признаков для анализа текстовых данных.

03 Научитесь использовать популярные библиотеки для обработки естественного языка

04 Оценивать качество алгоритмов с помощью методов валидации данных.

05 Реализовывать методы классификации и разметки текстов, включая сверточные (CNN) и рекуррентные (RNN) нейронные сети.

06 Снижать размерность данных и применять эти методы для извлечения ключевых слов, суммаризации текстов и тематического моделирования.

07 Работать с предобученными языковыми моделями (BERT, GPT и др.) для решения задач обработки текстов.

08 Применять библиотеки машинного обучения (Scikit-learn, NLTK, gensim) в реальных проектах.

09 Анализировать текстовые данные с использованием современных методов машинного обучения.

10 Готовиться к работе с коммерческими и исследовательскими проектами в области NLP.

Программа курса

01 Основы машинного обучения

Задачи машинного обучения. Базовые библиотеки для машинного обучения (Pandas, Scikit-learn, Matplotlib).

Признаки и работа с ними. Валидация данных и оценка качества алгоритмов. Функции потерь, метрики качества. Разделение набора данных. Кросс-валидация.

Практика: Предобработка и визуализация данных, классические модели ML.

[Теория — 2 часа, практика + демо — 2 часа, д/з — 1,5 часа]

02 Основы обработки текстов

Задачи обработки текстов. Методы предобработки и выделения признаков в анализе текстов.

Предобработка текстов: “мешок слов”, TF-IDF, регулярные выражения, сегментация, лемматизация, стоп-слова, части речи. Простые векторные представления слов: Оne-hot векторы, SVD, Hashing Trick.

Библиотеки NLTK, gensim, SpaCy, Yargy.

Практика: Предобработка текстов.

[Теория — 1 час, практика + демо — 3 часа, д/з — 1 час]

03 Эмбеддинги в обработке текстов

Обучаемые векторные представления слов: word2vec (CBOW, skipGram), GloVe, fastText. Методы обучения и донастройки неглубоких эмбеддингов. Использование неглубоких эмбеддингов для классификации.

Практика: Использование word2vec и fastText.

[Теория — 1 час, практика + демо — 3 часа]

04 Методы классификации и разметки текстов

Архитектура и применение сверточных нейронных сетей для задач классификации.

Разметка последовательностей: скрытые марковские модели, рекуррентные сети. Сети RNN, LSTM, GRU.

Извлечение именованных сущностей.

Практика: Использование CNN и LSTM.

[Теория — 1 час, практика + демо — 3 часа, д/з — 3 часа]

05 Методы снижения размерности

Извлечение ключевых слов. Суммаризация текстов. Тематическое моделирование: PLSA, LDA, ARTM.

Практика: Использование BigARTM.

[Теория — 1 час, практика + демо — 3 часа, д/з — 2 часа]

06 Предобученные языковые модели

Архитектура трансформеров, механизмы внимания. Энкодерные архитектуры ELMo, BERT, RuBERT.

Декодерные архитектуры GPT2, GPT3, RuGPT. XLNet. Мультиязычные модели.

Практика: Использование BERT, RuGPT.

[Теория — 1 час, демо — 3 часа, д/з 1,5 часа]

07 Всего: теория — 7 часов (30%), демо и практика — 17 часов (70%). Домашние задания — 9 часов (+ 38%)

42 900 ₽

38 610 ₽ — для физ. лиц

Записаться на курс

Для кого

Дата-аналитик

Разработчик

Архитектор ПО

Проектировщик

ML Engineer

Предварительная подготовка

Умение читать простой код на Python и писать на любом скриптовом языке.

Расписание курсов

08.09.2026 - 15.09.2026

Дата и время:

08.09.2026-15.09.2026

Тренер: Аксёнов Сергей

Middle 24 часа

42 900 ₽

38 610 ₽ — для физ. лиц

Записаться

Смотреть полное расписание

Курс проводят

Аксёнов Сергей

Специалист в области разработки ПО

О тренере

Специалист в области разработки высокопроизводительных систем искусственного интеллекта в прикладных областях с опытом работы более 20 лет, кандидат технических наук, работает в области аналитики данных, искусственного интеллекта и высокопроизводительных вычислений с 2002 года.

Доцент Томского политехнического университета (ТПУ, специализация: Технологии Больших данных), Томского государственного университета (ТГУ, специализация: Интеллектуальный анализ Больших данных), Томского государственного университета систем управления и радиоэлектроники (ТУСУР, специализация: Программная инженерия), Сибирского государственного медицинского университета (СибГМУ, специализация: Медицинская кибернетика). Является преподавателем вышеперечисленных университетов, преподает дисциплины, связанные с ключевыми областями своих знаний.

С 2018 года проводит курсы по профессиональной переподготовке. Занимается разработкой и актуализацией образовательных материалов.

42 900 ₽

38 610 ₽ — для физ. лиц

Записаться на курс

42 900 ₽

38 610 ₽ — для физ. лиц

Юр. лицо — 42 900 ₽

Физ. лицо — 38 610 ₽

08.09.2026, Онлайн

Ознакомлен с политикой обработки персональных данных

Cоглашаюсь с условиями обработки персональных данных

Отзывы и кейсы

Отзывы учеников

Читать все отзывы

Курс: Машинное обучение для анализа естественного языка (NLP)

Считаю полезным взаимодействие с реальным опытным специалистом. Понравились: - блокноты jupiter с исходным кодом, предоставленные авторов вебинаров, которые уже имеют полезные инструменты, и шаги их использования. Так появилась возможность сразу же попробовать свои примеры, а не искать инструкции и строчки кода по всему интернету - старательное объяснение сложных технических нюансов более простым языком - предоставленная уважаемым Сергеем Аксеновым возможность дальнейшего взаимодействия по теме с ним через соц-сети - возможность просмотров записей вебинаров - это наверное один весомых плюсов, потому что я не всегда мог присутствовать онлайн, а если и присутствовал, то у меня была ночь с пониженной производительностью и восприятием информации.

Вадим Канарский

Курс: Машинное обучение для анализа естественного языка (NLP)

Получил больше чем рассчитывал, сложно сказать что именно наиболее полезно, но очень понравилось насколько материал был подролбно объяснен

Александр Лаппо

Курс: Машинное обучение для анализа естественного языка (NLP)

Преподаватель довольно подробно разъяснял тематику программы

Сергей Бурлов

Наши ученики работают в:

Наши клиенты

Связанные курсы

EAS-020

24 часа

Основы машинного обучения

Основы машинного обучения: классификация, регрессия, кластеризация, ансамбли, нейронные сети. Курс дает представление об основных группах методов машинного обучения и их применении для решения задач анализа текстов, прогнозирования цены и выдачи рекомендаций. В практической части курса участники будут работать с признаками, перебирать параметры моделей и строить ансамбли, используя язык Python.

от Middle

34 500 ₽

EAS-025

24 часа

Машинное обучение на практике

Практический курс по машинному обучению для аналитиков и разработчиков. Освоите полный цикл создания ML-моделей от подготовки данных до презентации результатов. Уникальность: курс построен на реальных кейсах, что позволяет сразу применять знания на практике. Ценность: научитесь решать реальные бизнес-задачи с помощью машинного обучения, повышая эффективность и точность решений.

от Middle

42 000 ₽

Получить материалы

Ознакомлен с политикой обработки персональных данных

Cоглашаюсь с условиями обработки персональных данных

Запрос нового пароля

Новый пароль отправлен

Машинное обучение для анализа естественного языка (NLP)

42 900 ₽

Улучшаемые навыки

Инструменты

Чему вы научитесь

Программа курса

42 900 ₽

Для кого

Предварительная подготовка

Расписание курсов

Курс проводят

Аксёнов Сергей

О тренере

42 900 ₽

Записаться на курс

Наши ученики работают в:

Наши клиенты

Связанные курсы

Получить материалы

Нужна помощь? Оставьте заявку, и мы свяжемся с вами в ближайшее время