31 марта 2022 2402
Ксения Агеева, гуру в области BI, анализа и визуализации данных расскажет о Tableau — инструменте, который изменил подход к визуализации данных.
Tableau: визуализация данных для каждого

Всем привет. На связи BI Office в Luxoft и я — Ксения Агеева, причастная к анализу и визуализации данных на протяжении последних семи лет. Меня часто спрашивают, зачем в моей жизни есть Tableau, если весь мир всё равно любит эксельные таблички. Так что я решила показать, как без специального обучения можно получить профит от одного из самых популярных BI-инструментов — Tableau.

История получилась довольно длинной, так что продолжение ищите под катом.

Для кого статья

Этот материал может пригодиться не только аналитикам, но и специалистам, которые так или иначе имеют в своём арсенале какие-то эксельки с формулами и графиками.

Кроме того, это может быть отличным способом автоматизировать регулярную отчётность без знания языков программирования и быстрее собирать нерегулярные отчёты по запросу. А также красиво представлять данные в виде графиков и готовить ежемесячную презентацию для руководства в несколько раз быстрее. А ещё это классный скилл для резюме ;)

Немного теории

В нашей компании развито использование Tableau внутри HR-подразделений (рекрутмент, HR бизнес-партнёры), и это ещё один аргумент, чтобы узнать эту тему ближе. Почему-то принято считать, что HR и рекрутмент — это не самые активные пользователи чего бы то ни было точного, а здесь они не просто используют отчёты, но и модифицируют их под свои задачи.

Но начнём с короткого кусочка теории.

Прежде всего вкратце поймём, что такое Business Intelligence (BI) в целом. Сам по себе термин по меркам IT-вселенной не новый, ему больше шестидесяти лет, однако за это время он успел немного переосмыслиться и завоевать приличную популярность. По сути BI — это структурирование информации, превращение сырых данных в форму, с которой может работать бизнес-аналитик. А также под аббревиатурой BI принято понимать набор инструментов, которым этот бизнес-аналитик будет пользоваться.

BI-инструменты

Безусловно, существуют разные платформы и расширения-обвязки для анализа и визуализации информации, начиная от пресловутого MS Excel / Power Point, и заканчивая Python / R, где ты уже оп! — и одной ногой программист. Вариантов специализированных BI-платформ множество, в России наиболее на слуху, пожалуй, Tableau, MS Power BI и семейство Qlik.

Принципиальная задача любого BI-инструмента состоит в том, чтобы облегчать жизнь человеку, который с ним работает, и давать возможность максимально погрузиться в сами данные. Облегчение порой выглядит довольно условным — всё равно нужно как-то обработать информацию перед загрузкой в BI-систему (привет, Power BI). Но мы сегодня говорим о довольно узкой задаче — быстром базовом анализе и визуализации данных. Вот что говорит рейтинг SelectHub по этому поводу:




Так что тема «Какое BI решение лучше?» неисчерпаема, и можно очень долго спорить по этому поводу. Но именно за счёт довольно лёгкого старта Tableau может познакомить вас с этой вселенной, а дальше уже захочется исследовать и другие решения.

Tableau: чем он прекрасен

Tableau хорош тем, что его возможности можно как следует изучить или на бесплатной бесконечной public-версии, или на триальной desktop-версии. Отличие одно: публичная версия позволяет сохраняться только на сервер tableau.public, а десктопная — на свою рабочую машину. В остальном они не отличаются по функционалу.

Поэтому если ваши данные содержат коммерческую тайну или персональные данные, то Tableau вам будет полезен скорее для разовых акций создания отчётов. Они, кстати, вполне могут убедить ваше руководство, что нужно обзавестись полноценной версией Tableau и начать делать такую магию постоянно. Часто люди вначале оттачивают навыки на публичной версии, затем пробуют создавать что-то в десктопной, а после этого иногда окончательно обращаются в BI-аналитиков.

  В чём бонусы Tableau? Давайте по пунктам:
  • подключение к десяткам разных источников данных, в том числе к различным базам данных, Google Таблицам, тем же эксельным или текстовым файлам, которое делается в пару кликов;
  • удобное соединение нескольких таблиц в один источник данных через drag-and-drop, а также возможность легко собрать данные из таблиц с разным уровнем детализации;
  • интуитивно понятный интерфейс (правда, без русификации) и построение визуализаций через drag-and-drop;
  • можно красить и перекрашивать всё созданное в любые цвета, отчёт можно мгновенно сделать из синего зелёным. Безграничные возможности игр со шрифтами тоже в комплекте;
  • возможность добавить интерактив: графики могут работать как фильтры, можно совмещать отчёт и связанную с ним веб-страницу в одном окне, рассказывать целые истории и использовать наполненные данными карты;
  • подробная базовая справка Tableau и очень отзывчивое community (а вот тут уже и русификация есть).
  • Мои любимые примеры визуализаций с tableau.public могут доказать, какие разные вещи можно здесь создавать. От совсем простых до совершенно магических.

Как работает Tableau

Но ни одна история не будет полной без экспериментов, поэтому давайте посмотрим на примеры. Сразу оговорюсь, что это не полноценное руководство пользователя, некоторые шаги я опустила, чтобы не превратить этот длинный пост в совсем уж унылую простыню. Но несколько картинок описания пути вы сможете увидеть ниже.

Итак, я создала тестовый источник данных, в котором содержится список сотрудников, их роли, города, отделы, менеджеры, зарплаты, а также даты старта в отдельной таблице.

Подключаемся к экселю:




И вот мы видим все наши поля в интерфейсе. Дальше их можно тянуть на рабочую область и выбирать виды графиков или таблиц:



Тянем город на строки, количество записей — на столбцы (Number of Records — автоматически созданное поле с количеством записей; так можно в этом примере, потому что у нас одна строка соответствует одному сотруднику).

И выбираем Bar в секции Marks. Здесь как раз видно, сколько видов базовых визуализаций (чартов) доступно. А их ведь можно сочетать друг с другом! Вариантов множество.





Если тыкнуть в Show Me в правом верхнем углу, то появится панель с рекомендациями, какой чарт выбрать. Если картинка бледная — значит, полей добавлено недостаточно, и Tableau даже подскажет, какого рода должны быть эти поля.





Допустим, нас с вами интересует медианная зарплата в разрезе роли — для этого нам нужно создать новый worksheet, например через панель справа снизу — создание worksheet, dashboard и story слева направо:





В открывшейся новой вкладке тянем роли на строки, добавляем количество сотрудников и зарплату (Total income) на иконку Labels в секции Marks. Для удобства я оставила только топ-10 ролей по количеству записей в таблице.

В меню выбираем медиану и получаем ещё один полезный вид визуализации — таблицу с медианами. Если выбрать Bar в секции Marks, но не перетаскивать Number of records на Columns — бар-чарта не будет, полоска останется вписанной в таблицу. Чтобы её размер соответствовал медиане, я перетащила Total Income на иконку Size. На этих числах видно не очень хорошо, но это правда.




Кстати, здесь можно заметить разные виды калькуляций — любимое всеми среднее арифметическое и даже стандартное отклонение. При желании можно все эти калькуляции поместить в одну таблицу и довести заказчика (и себя) до статистического экстаза.

Используя другие поля из нашей таблицы и другие виды графиков, строим ещё парочку чартов, помещая каждый на отдельный лист.

Теперь у нас достаточно элементов, и можно собирать картинку воедино. В один клик создаём новый дашборд. Помним про панель снизу (для красоты я использовала заготовленный драфт, который можно создать единожды и использовать в дальнейшем, чтобы несколько раз не добавлять заголовки и логотип вашей компании).

Получается вот так:




Обратите внимание на подписи данных. В том же экселе добавление трёх строчек на диаграмму требует некоторых шаманств вроде выбора дополнительных столбцов, расчёта процентов отдельной колонкой и прочего. Здесь же достаточно перетащить нужные поля на Labels и выбрать нужную калькуляцию (например, процент от тотала):




Ещё мы хотим быстро понимать, кто все эти люди — создаём ещё один лист с таблицей сотрудников, перетягивая в строки практически все поля:




Этот лист найдёт своё место в нижней части дашборда рядом с табличкой с медианами.




Неплохо? Согласна.

Но теперь можно это сделать ещё и интерактивным. После нажатия на иконку воронки на листе с городами мы получим возможность по клику фильтровать все остальные элементы на дашборде:




Вот так:




Так можно поступить со всеми графиками, и тогда интерактива станет ещё больше. Вообще эффект от взаимодействия пользователя с отчётом можно настраивать по-разному — к примеру, в виде последовательности шагов.

А ещё можно вывести фильтры отдельно и добавить возможность выбирать из списка то, что решили не визуализировать. В этом дашборде мы не строили график по менеджерам, но с помощью фильтра справа менеджер определённого подразделения сможет посмотреть только своих сотрудников.




И ещё можно сделать фильтры более компактными, чтобы больше влезло не перегружать пользователя лишней информацией.




Ещё нам может внезапно прийти в голову добавить данные из другой таблицы, например дату старта. В оригинальной таблице у нас её нет, но отдельный список существует. В экселе нам бы пришлось делать, например, VLOOKUP, а тут достаточно на вкладке data source перетащить новую таблицу и определить поле, по которому они будут связаны с оригинальной — уникальный номер сотрудника идеально подойдёт.




Это джойн, левый джойн, знакомьтесь. Он позволяет нам случайно не потерять данные из оригинальной таблицы из-за отсутствия некоторых сотрудников в новой. Вообще виды соединений — это вот так (хором «спасибо!» неизвестному автору мема):




Но вернёмся. С помощью соединения мы получили новые поля и можем, например, рассчитать срок работы сотрудника в компании. Справка Tableau подсказывает нам, как использовать функцию разности дат:




Такие штуки я люблю добавлять на маленький лист в виде одного числа. И для этого нужно лишь перетянуть наше новое поле на Text и выбрать Average:




Добавляем на дашборд, немного причёсываем дизайн и получаем уже более цельную картинку:




Самое великолепное — всё это можно скачать из веба в разных форматах. Да-да, в том числе обратно в эксель. К сожалению, многие так и поступают.





Заключение

В этот эпос не вошло много интересного: всплывающие подсказки, истории, карты, переходы с одного дашборда на другой и т. п. На создание этой штуки ушло минут 25 — я текст дольше писала. Конечно, на первых порах процесс будет идти медленно, но оно того стоит. Всё, что можно автоматизировать, нужно автоматизировать, а дальше разберёмся.

Чтобы не быть совсем уж голословной в конце: вам достаточно изучить хотя бы раздел Getting Started с официальной странички Tableau, и вы сможете построить похожий отчёт самостоятельно. Youtube полнится интересными видео, так что дальнейшее развитие полностью в ваших руках.

Датасет, если вы хотите попрактиковаться именно на нём, приложен тут. А чтобы убедиться в том, что оно и правда живое — вот ссылка на дашборд в Tableau Public — можно погладить и почесать за ушком :)

Спасибо за внимание!

Источник: https://habr.com/ru/company/luxoft/blog/569016/

Последние статьи в блоге

Системный аналитик 100 lvl — дорожная карта развития

Все, что нужно знать для роста в профессии: какие блоки знаний проседают у системных аналитиков больше всего, на какие компетенции важно обратить внимание, чтобы двигать карьеру дальше, и как подтвердить соответствие своего уровня единому стандарту качества.

23 декабря 2024

Платформа сертификации IBS признана лучшим digital-решением для корпоративного обучения

Центр сертификации IBS стал обладателем Гран-при премии «Смарт пирамида» — одной из самых престижных российских премий за достижения в области обучения и развития человеческого капитала.

20 декабря 2024

Учебный центр IBS получил сертификат ГОСТ Р ИСО 9001-2015

В октябре 2024 года Учебный центр IBS получил сертификат соответствия ГОСТ Р ИСО 9001-2015. Это важное достижение подтверждает, что мы придерживаемся высоких стандартов качества и результативно управляем образовательными процессами организации.

19 декабря 2024

9 курсов со скидкой до 50%

Друзья, в январе стартует 9 курсов, обучение на которых можно купить со скидкой до 50%*! 

15 декабря 2024

8 заблуждений про тестирование

Тестирование программного обеспечения окружено множеством заблуждений. Эти стереотипы нередко приводят к недопониманию его реальной роли и важности для успешного создания продуктов. Рассмотрим восемь самых распространенных мифов о тестировании и объясним, почему они не соответствуют действительности.

15 декабря 2024

Путь к Fullstack-тестировщику: что нужно знать о ручном и автоматизированном тестировании?

Тестирование программного обеспечения — одна из самых востребованных областей в IT. И часто новички и даже опытные специалисты, желающие строить свою карьеру в этом направлении, часто сталкиваются с вопросом: какое тестирование выбрать — ручное, автоматизированное или Fullstack? У каждого из этих направлений свои особенности, преимущества и требования к знаниям. В этой статье рассмотрим каждое из направлений, их плюсы и минусы, области применения и навыки, необходимые для успеха.

15 декабря 2024

Совет по развитию сертификации ИТ-специалистов при АПКИТ аккредитовал «Платформу сертификации IBS»

Директор департамента обучения и развития IBS Владимир Гернер участвовал в заседании Совета по сертификации ИТ-специалистов при АПКИТ.

Новости Жизнь компании
08 октября 2024

Java-сертификация: IBS в сравнении с Oracle

Игорь Судакевич рассказывает, почему сертификаты могут стать важным инструментом для достижения карьерных целей.

Новости
04 октября 2024

Исследование IBS: число новых ИТ-решений в реестре ПО выросло в 2023 году более чем на треть

Анализируем ситуацию на рынке российского ПО.

Жизнь компании
01 октября 2024

6 суперспособностей Fullstack-тестировщиков, которые напоминают навыки животных

Читайте о скиллах, которые делают тестировщиков востребованными на рынке труда.

27 сентября 2024

5 мифов о системных аналитиках

Вместе с Екатериной Тихомировой, специалистом по системному и бизнес-анализу, разбираемся, чем занимаются системные аналитики.

20 сентября 2024

Методология 12 факторов: как успешно разрабатывать облачные приложения

Андрей Бирюков рассказывает о методологии, которая помогает разрабатывать качественные, устойчивые и эффективные веб-приложения.

12 сентября 2024

Баги, которые стали фичами

Многие вещи, которые мы используем ежедневно, были случайно открыты. В честь дня тестировщика рассказываем про 5 багов, которые стали фичами.

09 сентября 2024

Шаблоны облачного проектирования

Читайте про наиболее популярные шаблоны облачного проектирования: шаблон Bulkhead и шаблон Sidecar.

06 сентября 2024

Бесплатные мини-курсы ко Дню знаний

Друзья, поздравляем с Днём знаний! Желаем любопытства, открытий и новых побед!

02 сентября 2024

5 курсов со скидкой 30%

Друзья, в сентябре стартует 5 курсов со скидкой 30%*

29 августа 2024

Исследование IBS: на одну вакансию в Java-разработке приходится 4 резюме

По данным исследования рекрутингового центра IBS, наибольшая конкуренция среди соискателей наблюдается среди Python-разработчиков: на одну вакансию приходится 10 резюме. В менее конкурентной среде находятся Java-разработчики (4 резюме на одну вакансию). Самыми дефицитными являются специалисты по языку Go: менее 2 резюме на одну вакансию.

28 августа 2024

Индексирование баз данных в PostgreSQL: погружение в тему

В продолжение серии статей об устройстве системы управления базами данных (СУБД) PostgreSQL (раз, два) смотрим, как ускорить выполнение запросов к базе данных с помощью индексов.

28 августа 2024

Книги для системных и бизнес-аналитиков, а также будущих и нынешних архитекторов

Наш коллега, архитектор информационных систем Сергей Политыко, поделился полезными книжными рекомендациями.

Жизнь компании
19 августа 2024

Сценарии кибератак с использованием ИИ. Внутренний периметр.

Кибератаки, направленные на внутренние периметры организаций, становится особенно актуальной темой. Внутренние атаки могут происходить как от злоумышленников с доступом к ресурсам, так и извне, используя уязвимости внутренней инфраструктуры. Использование ИИ в таких атаках позволяет автоматизировать и улучшить процесс поиска уязвимостей, создать вредоносный код и разработать методы социальной инженерии, что увеличивает скорость и масштаб атак. Расскажем про сценарии таких атак подробнее.

16 августа 2024

Не нашли, что искали? — Просто напишите, и мы поможем

Продолжая, я подтверждаю, что ознакомлен с Условиями использования и Порядком обработки персональных данных
Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.