Kafka Advanced
На тренинге вы углубите свои базовые знания об Apache Kafka: узнаете архитектуру Kafka, устройство Producer и Consumer, надежную доставку сообщений, использование Kafka Connect, Kafka Streams и ksqlDB. Помимо теоретических знаний вы получите практические навыки, которые помогут применить полученные знания в своей работе.
30 ак.ч.
Онлайн
EAS-030
Kafka Advanced
Записаться на курс
Длительность
30 ак.ч.
Локация
Онлайн
Код
EAS-030
Расписание и цены
24.06.2024 - 12.07.2024
45 500 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей
Kafka Advanced
Записаться на курс
Длительность
30 ак.ч.
Локация
Онлайн
Код
EAS-030
Расписание и цены
24.06.2024 - 12.07.2024
45 500 руб.
* Для физических лиц действует скидка 10% Закажите корпоративное обучение с учетом ваших потребностей

Описание

Этот тренинг будет полезен слушателям, которые работают с Apache Kafka и хотят углубить свои знания и навыки в этой области.

В рамках данного тренинга вы изучите различные аспекты Kafka, начиная с архитектуры и основных компонентов, таких как кластеры, брокеры и клиенты. Вы освоите концепцию топиков и разделов, а также настройку параметры производительности Kafka.

Тренинг также включает модуль, посвященный устройству Producer и Consumer. Вы освоите внутреннее устройство Kafka Producer и Consumer, включая потоки, буферы и таймауты, а также узнаете о смещениях, группах получателей и методах сохранения смещений.

В следующем модуле рассматривается надежная доставка сообщений. Вы ознакомитесь с различными гарантиями порядка сообщений и доставки, включая гарантии "at least once" и "exactly once", а также узнаете о транзакциях, обработке ошибок и повторной передаче сообщений.

Вы изучите Kafka Connect, инструмент для создания конвейеров данных, рассмотрите внутреннее устройство Kafka Connect, настройку и преобразованиях данных, примеры коннекторов.

Другой важный модуль тренинга посвящен Kafka Streams – библиотеке для обработки и анализа данных в реальном времени. Вы изучите такие концепции, как сериализация, окна, агрегирование и сохранение состояния, познакомитесь с Processor API и научитесь использовать Kafka Streams для создания потоковых приложений.

Тренинг завершается изучением ksqlDB – расширения Kafka, предоставляющего SQL-подобный интерфейс для работы с данными. В рамках данного модуля вы узнаете о потоках, таблицах, преобразованиях и непрерывных запросах в ksqlDB, а также ознакомитесь с методами развертывания кластера ksqlDB.

В каждом модуле тренинга предусмотрено выполнение практических заданий, которые помогут освоить знания и решать реальные задачи, связанные с обработкой данных в реальном времени.

Цели

  • Углубить понимание архитектуры и функциональности Kafka;
  • Овладеть навыками разработки с использованием Kafka, включая настройку Producer и Consumer, обработку ошибок, настройку параметров производительности и использование инструментов Kafka Connect, Kafka Streams и ksqlDB;
  • Понять принципы надежной доставки сообщений и научиться их применять на практике.

Целевая аудитория

Разработчики, архитекторы, инженеры данных, DevOps-инженеры, тестировщики.

Предварительная подготовка

Обязательно:
  • опыт работы с Kafka;
  • базовое знание Java \Scala.
Желателен опыт работы с Docker, Linux

Разбираемые темы

  • Модуль 1. Архитектура Kafka (2 часа теории, 2 часа практики)

    • Кластер, брокеры, клиенты
    • Топики и разделы
    • Очистка сегментов (retention, compaction)
    • Репликация, лидеры и следующие, ISR
    • Контроллеры, KRaft
    • Настройка производительности
    Практика: запуск кластера, запись в и чтение сообщений из тем, работа с темами (вывод списка и описаний), работа с разделами (увеличиваем количество), изменение параметров тем, работа с сегментами (просмотр информации о сегментах, смещениях, записях), работа с репликами (проверка поведения при отказе брокера), тестирование производительности кластера.
  • Модуль 2. Устройство Producer и Consumer (1,5 часа теории, 1,5 часа практики)

    • Внутреннее устройство: потоки, буферы, таймауты
    • Смещения, группы получателей
    • Автоматическое и ручное сохранение смещений
    • Перебалансировка группы
    Практика: изучение влияния параметров производителя на производительность при отправке сообщений, проверяем влияние параметров потребителя на производительность при чтении сообщений.
  • Модуль 3. Надежная доставка (1,5 часа теории, 1,5 часа практики)

    • Гарантии порядка сообщений
    • Гарантии доставки at least once, exactly once
    • Транзакции
    • Обработка ошибок и повторная передача
    • Сбои сети, брокеров и клиентов
    Практика: разработка приложений, которые используют транзакции.
  • Модуль 4. Kafka Connect (4 часа теории, 4 часа практики)

    • Конвейеры данных
    • Обзор Kafka Connect
    • Внутреннее устройство
    • Преобразования
    • Запуск Kafka Connect
    • Примеры коннекторов
    • Разработка коннекторов
    Практика: работа с Kafka Connect — запуск разных сценариев интеграции с внешними системами.
  • Модуль 5. Kafka Streams (4 часа теории, 4 часа практики)

    • Источники и приемники
    • Сериализация, SerDe, схемы сообщений
    • Окна
    • Преобразования
    • Агрегирование
    • Сохранение состояния
    • Транзакции
    • Processor API
    Практика: разработка приложений Kafka Streams с использованием разных API.
  • Модуль 6. ksqlDB (2 часа теории, 2 часа практики)

    • Источники и приемники
    • Потоки и таблицы
    • Преобразования
    • Непрерывные запросы
    • Окна
    • Агрегирование
    • Транзакции
    • Развертывание кластера ksqlDB
    Практика: работа с ksqlDB — интеграция с Kafka Connect, преобразования сообщений, непрерывные запросы.
  • Всего: теория – 15 ч. (50%), практика – 15 ч. (50%)

  • Развернуть программу
Раcписание курсов
Вид:
24.06.2024 - 12.07.2024
18:00-20:00
Локация:Онлайн
Длительность:30 ак.ч.
Время:18:00-20:00
45 500 руб.
Записаться
Смотреть полное расписание
Тренеры
Заигрин Вадим
Специалист в области BigData

О проектах

В рамках своей профессиональной деятельности занимался:
  • развертыванием, управлением и программированием Apache Hadoop, Spark, Kafka и Greenplum;
  • разработкой моделей машинного обучения в Spark и внедрение их в производство;
  • разработкой интеграции Apache Hadoop с СУБД и СХД;
  • разработкой и программированием решений на Google Cloud Platform и Яндекс.Облаке;
  • разработкой информационной безопасности для Apache Hadoop с Ranger и Atlas;
  • программированием на Scala, Java, Python, R, SQL, Go, C и Lisp.
Ваши преимущества
Экспертность
Тренеры-эксперты из реальных проектов крупнейших компаний, лидеров в своей отрасли
Живое обучение
“Живая” коммуникация с тренером даже в онлайн-формате
Практика
Максимально наполненные практикой занятия, работа в группах, выполнение домашних заданий
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.