О чём вебинар
На вебинаре рассмотрим классические и современные подходы к классификации и кластеризации текстов, нейросетевые методы переписывания и генерации текстов.
Слушатели пройдут путь от нескольких вариантов постановки задач обработки текстов через классические способы представления текстов в виде мешка слов к современным векторным представлениям (word2vec и fasttext), позволяющим выявлять взаимосвязи слов в тексте.
Мы рассмотрим устройство современных языковых моделей, процессы их обучения и способы использования, в том числе, путем дообучения и встраивания в конвейеры обработки. Также мы расскажем о том, как эти методы могут быть применены в различных сферах, включая машинное обучение, анализ информации, обработку естественного языка и многое другое. Присоединяйтесь к нам, чтобы узнать больше о том, как эти инструменты могут помочь в вашей работе!
Цели вебинара:
- познакомить участников с основными методами анализа и обработки текстов, используемыми в современных исследованиях;
-
рассмотреть преимущества и недостатки различных методов анализа и обработки текстов, чтобы помочь участникам выбрать наиболее подходящий подход для своих исследований;
-
показать основные классы задач, решаемые методами анализа текстов;
-
продемонстрировать способы использования готовых моделей и методы их донастройки на требуемую тематику.
Содержание
1. Задачи анализа и обработки текстов.
2. Способы предобработки текстов и выделения признаков.
3. Обучаемые векторные представления слов и текстов (эмбеддинги).
4. Классификация текстов.
5. Тематическое моделирование.
6. Предобученые языковые модели (трансформеры и их разновидности).
7. Дообучение и настройка языковых моделей.
Другие разделы