О чём курс
Этот тренинг рассматривает возможности языка программирования Python для сбора и анализа данных. Python является современным, мощным языком программирования, который позволяет разрабатывать сложное программное обеспечение с использованием традиционного императивного программирования, использовать возможности функционального программирования и создавать повторно используемый код на основе объектно-ориентированного подхода. Этот тренинг ориентирован на начинающих (Junior) программистов, а также более опытных разработчиков (Regular), которые переходят на Python с других языков программирования и желают изучить его экосистему.
Тренинг охватывает следующие темы:
Введение. Здесь рассматривается история Python, а также приводится информация о программном обеспечении, которое будет использовано на тренинге.
Описание проекта. В этом разделе приводится описание разрабатываемого проекта.
Регулярные выражения. В этом модуле подробно рассматривается работа с регулярными выражениями в языке Python. Регулярные выражения используются для поиска информации по шаблону, а также при разборе текста (парсинге) и для изменения.
Работа с HTTP-клиентом. В этом модуле слушатели изучают взаимодействие по протоколу HTTP к web-серверам и микросервисам
Графический интерфейс пользователя в Python. wxPython. Этот модуль полностью посвящен разработке графического интерфейса пользователя на основе обертки кроссплатформенной библиотеки wxWidgets для языка Python – wxPython.
Математика в Python. NumPy. В этом модуле слушатели изучат основы использования мощной математической библиотеки для работы с векторами и многомерными матрицами.
Анализ данных с помощью Pandas. Завершающий модуль тренинга фокусирует слушателей на анализе данных с помощью библиотеки Pandas, что является актуальным для всех, кто хочет анализировать и делать выводы на основе большого объема данных. Также в рамках модуля будет рассмотрен процесс построения графиков на основе собранных ранее данных.
Цели
Освоить необходимые компетенции для сбора данных, математической обработки и анализа данных с применением языка Python.
Целевая аудитория
Junior и Regular разработчики на языке Python.
Предварительная подготовка
Понимание принципов парадигмы объектно-ориентированного программирования.
Понимание принципа работы протокола HTTP.
ИЛИ
Прохождение курсов SCRIPT-002, SCRIPT-003 или наличие опыта практической работы на Python от полугода.
Для кого
Разработчик
Data Scientist
Бизнес-аналитик
Системный аналитик
Улучшаемые навыки
Python
Регулярные выражения
HTTP-протокол
NumPy
Pandas
Визуализация данных
wxPython
GUI-разработка
Анализ данных
Big Data
Инструменты
Программа курса
01
Вступление. Краткое введение в курс
Основные особенности языка Python.
Получение исходного кода проекта.
Практика: подготовка виртуального окружения под будущий проект.
Базовые конструкции регулярных выражений.
Объединения и группы.
Match-объекты и группирующие скобки.
Сложные позиционные шаблоны (lookarounds).
Практика: разработка первого прототипа приложения для работы с курсами валют, поиск и группировка данных, получаемых из html-файла, с помощью регулярных выражений.
04
Работа с HTTP-клиентом
Основы пакета Requests. Доступные методы REST-API.
Содержимое ответа.
Переадресация.
Передача данных в запросе.
Практика: создание HTTP-клиента на базе Requests, получение html-страниц с данными с удаленного ресурса.
05
Графический интерфейс. wxPython
Введение в wxPython. Простейшее приложение.
Базовые элементы GUI.
Механизм связывания.
События.
Абсолютное и относительное позиционирование элементов.
Практика: разработка графического интерфейса приложения с набором необходимых элементов.
06
Математика в Python. NumPy
Знакомство с NumPy. Основы.
Работа с матрицами и n-мерными массивами.
Математические операции и алгоритмы.
Статистические метрики. Скользящая средняя (MA), простая скользящая средняя (SMA).
Практика: создание матрицы с набором статистических данных, вычисление скользящей средней.
07
Анализ данных с помощью Pandas. Графики
Основы Pandas.
Сбор и хранение данных в Pandas.
Вычисления в Pandas.
Визуализация данных, графики.
Практика: применение структур данных Pandas для хранения статистических данных, расчеты и построение графиков.
Чему вы научитесь
01
Собирать и обрабатывать данные с помощью регулярных выражений.
02
Взаимодействовать с веб-сервисами по протоколу HTTP.
03
Использовать NumPy для математических операций и работы с многомерными массивами.
04
Анализировать и манипулировать данными с помощью Pandas.
05
Создавать графические интерфейсы пользователей на wxPython.
06
Визуализировать данные с помощью matplotlib.