Улучшаемые навыки
ИИ
RAG
Качество данных
Конвейер данных
Промпт-инжиниринг
Автоматизация ИИ
Анализ данных
Оптимизация SQL
Чему вы научитесь
01
Генерировать сложные SQL-запросы
02
Автоматизировать проверку качества данных
03
Использовать ИИ для анализа и составления отчетов
04
Понимать и объяснять сложные SQL-запросы
05
Создавать и поддерживать аналитические пайплайны
06
Применять подходы RAG и агентов для анализа данных
Программа курса
01
Экосистема и контекстный промптинг.
Правильный вход: не «как работает нейросеть», а «как ей управлять»
Инструментарий:
Cloud (GPT-5.1/Claude 4/Gemini 3): для сложной логики и кодинга.
Local (Llama 4 / Mistral): для приватных данных (PII). Использование через LM Studio (GUI, без командной строки).
IDE: Связка VS Code + Cursor (AI-редактор) как новый стандарт.
Контекст — это всё (Business Logic Injection):
Почему одних схем таблиц (DDL) мало?
Техника Metric Dictionary: Создание `.txt` файла с определениями: «Active User = логин + 1 транзакция за 30 дней».
Практика: Скармливаем модели схемы таблиц (DDL) + словарь метрик и получаем корректный SQL вместо галлюцинаций.
02
SQL-мастерство с ИИ: генерация, оптимизация, понимание
Advanced Text-to-SQL:
Генерация сложных запросов: CTE, оконные функции, рекурсивные JOIN'ы.
Кейс: «Перепиши этот вложенный подзапрос через временный именованный набор данных (CTE)».
Оптимизация и работа с легаси:
Использование ИИ в роли администратора баз данных (DBA): «Почему этот запрос выполняется 10 минут? Предложи индексы или перепиши логику».
Объяснение чужого кода (Explain Plan на человеческом языке).
DQ (Data Quality) Checks:
Генерация SQL-тестов на лету: проверка дубликатов, NULL-ов и аномалий перед тем, как отдать данные в отчет.
03
Python, Pandas & Debugging: от написания кода к его исправлению.
Парсинг и ETL:
Быстрый парсинг «кривых» файлов (Excel с объединенными ячейками, JSON-логи) с помощью кода, написанного ИИ.
Переход с Pandas на Polars для больших данных по запросу «Оптимизируй этот скрипт».
Процесс отладки с помощью ИИ (критический навык):
Что делать, если код упал? (KeyError, NaN, Type Mismatch).
Практика:Копируем трассировку ошибки в логах -> Вставляем в ИИ -> Получаем исправленный блок. Итеративный ремонт кода.
Граничные случаи (Edge Cases):
Промптинг на поиск уязвимостей: «Что будет, если в колонке `date` придет пустая строка? Добавь обработку исключений».
04
Excel и BI-интеграции.
Low-code и «последняя миля» аналитики.
ИИ внутри Excel:
Copilot / Плагины: Генерация сложных формул и макросов (VBA/Google Apps Script) за секунды.
Regex в Excel: использование ИИ для написания формул извлечения текста, которые невозможно написать руками.
Взгляд в BI (Tableau/PowerBI):
Генерация кода для **Power Query (M) и DAX.
Генерация Calculated Fields для Tableau. (Демонстрация возможностей для самостоятельного изучения).
05
Визуализация и Data Apps.
Красивые отчеты без дизайнера.
Генеративная визуализация (Python):
Plotly/Altair: создание интерактивных графиков через описание: «Построй воронку с разбивкой по каналам и добавь тултипы».
Стилизация: применение корпоративных цветов через промпт.
Streamlit Apps:
Превращение скрипта анализа в веб-приложение.
Кейс: «Сделай интерфейс, куда я загружу CSV, а ты покажешь топ-10 товаров и кнопку скачивания отчета». (Код пишет ИИ целиком).
06
Генерация с расширенным поиском (RAG) и работа со знаниями.
Ваша личная «Википедия».
Генерация с расширенным поиском (RAG) на платформе Dify — без сложностей и ручной настройки:
Никаких эмбеддингов и векторных баз данных в коде.
Практика: Загружаем PDF-регламенты и описания баз данных в интерфейс Dify через кнопку «Upload Knowledge».
Сценарий «Чат с базой знаний»
Задаем вопросы: «Как мы считаем пожизненную ценность клиента (LTV) для B2B клиентов согласно регламенту от 2024 года?». Проверка ответов с ссылками на источник.
Автоматизация рутины.
Введение в n8n:
Визуальный конструктор процессов. Почему это лучше, чем cron + скрипты на сервере.
Сборка пайплайна (Live-режим):
Trigger: Письмо на почту с темой «Отчет».
Action: Python-нода (код от ИИ) для парсинга вложения.
Action: LLM-нода для анализа: «Напиши 3 главных вывода по цифрам».
Action: отправка саммари в Slack.
08
Итоговый проект (Capstone)
Формат: «Заполни Шаблон» (Fill-in-the-blanks).
Задача: участники получают готовый JSON-шаблон пайплайна n8n, но с пустыми узлами логики.
Действия:
Сгенерировать правильный SQL-запрос для извлечения данных (используя словарь метрик из Блока 1).
Сгенерировать Python-код для очистки и расчета (используя навыки отладки из Блока 3).
Написать системный промпт для финальной генерации бизнес-вывода.
Финал: Запуск пайплайна. Если в Telegram пришел красивый отчет — зачет.
Для кого
Дата-аналитик
Data Engineer
Data Scientist
Big Data Analyst
Предварительная подготовка
Базовые знания SQL и Python.