14 апреля 2022 907
Не секрет, что мощность и гибкость вычислений, простой синтаксис, подробная справка, множество примеров и простота создания расчетных полей - это то, за что все любят Tableau. Вместе с Ксенией Агеевой, гуру в области BI, мы разберем несколько полезных приемов, как создать удобную понятную конструкцию и с легкостью восстановить прошлый проект в этом незаменимом для бизнес-аналитика инструменте.
Пять лепестков лотоса: вычисляемые поля в Tableau

Не секрет, что мощность и гибкость вычислений в Tableau это очень активно используемая история. За счёт довольно простого синтаксиса, подробной справки и массы ранее заданных и отвеченных вопросов в комьюнити, создание расчетных полей - это наша реальность. Чтобы не тратить кучу времени на то, чтобы создать удобную понятную конструкцию, или с легкостью восстановить прошлый полет собственной мысли - давайте разберем несколько полезных приемов. Пост обещает раскрыть методы, которые существенно упрощают создание, тестирование и поддержку расчётов в Tableau.

Можно долго спорить на тему перфоманса и удобства поддержки - вообще, это всё тот же давний холивар на тему, переносить расчёты в код источника или нет. Всё, как всегда, зависит от задачи - насколько гибкими должны быть расчеты в репорте, как часто они меняются, существует ли репозиторий с кодом источников в DWH, и доступен ли он аналитикам, занятым визуализацией.

Но для нашего сегодняшнего погружения - давайте представим, что мы строим сложносочинённые расчёты именно внутри отчета. Прежде всего, давайте определимся, что вообще считать сложным. 

Вообще, даже если вы только начали свой путь, то вам могут казаться сложными любые расчёты дальше классических арифметических операций. Если вы в бою уже давно, то вы наверняка сталкивались со слоеными многоэтажными матерными конструкциями, которые через несколько вложений приводят к желаемому результату. Прекрасно то, что наши приемы пригодятся для вашего личного уровня сложности. Вычисления не будут нашей темой сами по себе, всё это так или иначе применимо и для создания кастомных полей при работе с текстом, группировкой элементов поля и прочей магией.

Итак, наш план таков: 

  1. Разделите логику на порции или этапы

  2. Разложите исходные поля по папкам

  3. Пронумеруйте поля и папки

  4. Создайте валидационный лист

  5. Прокомментируйте расчёты и добавьте pop-up описания

Всё! Если вы на опыте, то дальше можно не читать. Если же пояснения всё же нужны - давайте поговорим о каждом из приёмов чуть подробнее :)

1. Разделите логику на порции или этапы

Это однозначно то, с чего следует начать. Конечно, вполне можно добиться качественного результата и в одном калькулируемом поле - я видела, да и сама, признаться, когда-то создала немало таких примеров. Но читать портянку на несколько десятков строк довольно утомительно, иногда она банально не помещается на экране, а ещё бывает мучительно трудно найти все те закрывающие скобочки, которые вы упустили при изменении логики. 

Tableau это, всё-таки, не IDE, функционал подсказок ограничен, а потому порционное деление облегчает отслеживание последовательности преобразований, которые мы применяем к данным.

А ещё иногда Tableau проще выполнять несколько вычислений по отдельности. Например, в случае табличных вычислений, таких как INDEX и WINDOW_SUM. Если вы поместите их оба в одну калькуляцию, вы рискуете потерять некоторую гибкость при вычислении таблицы, и, как следствие, контроль над результатом. 

Проще всего применять хронологическое разделение, когда вы делите расчёт на отдельные шаги, выполняемые последовательно. Если по пути вы применяете какие-то типичные формулы - их гораздо легче будет воспринимать, если элементы этих формул будут представлять собой отдельные калькуляции, а финальная формула будет собрана из этих калькулируемых полей.




Еще одним неплохим способом будет разделение калькуляций на смысловые группы, применяемые к однотипным измерениям и мерам. Например, простенький план может выглядеть вот так:

  1. Bonus base

  2. Bonus values

  3. Weights %

  4. Coefficients

  5. Final Bonus

Важно здесь то, что нам нужно сделать много разных мелких вычислений. Большинство из этих вычисляемых полей представляют собой пару строк - и их гораздо легче понять по отдельности. Если у вас всё-таки остались условно крупные куски логики - позаботьтесь об отступах, чтобы уровни было хорошо видно.




И, что не менее важно - контроль корректности. Вы строите один расчет, проверяете, что всё правильно, затем переходите к следующему шагу, постепенно наращивая цепочку до тех пор, пока не достигнете конечной цели.

2. Разложите по соответствующим папкам

Здесь стоит сказать очевидное - по умолчанию поля в панели слева будут расположены в алфавитном порядке. Если вы использовали джойны источников на уровне отчета - вы увидите ещё и группировку по источникам данных. Она полезна, когда достаточно просто знать источник, из которого берется поле, но все кастомные поля в таком случае будут лежать внизу списка, что тоже не всегда удобно. 

Вот так выглядит дефолтный алфавитный порядок полей. Хорошо, когда полей штук десять, ну может двадцать. А если больше?




Если в вашем отчете будет много калькуляций - критически посмотрите на список полей и создайте смысловые папки для исходных полей тоже. Да, это отнимет дополнительное время, но его же (и даже больше) вы сэкономите в дальнейшем на розыск нужного поля. Для исходных полей это может быть группировка в разделы по смыслу, каждый из которых вы назовете таким образом, чтобы легко понимать, что лежит внутри.




3. Пронумеруйте поля и папки

А дальше можно работать с нумерацией самих полей, которые участвуют в реализации логики. Вернитесь к вашему плану из первого пункта и логическим порциям, присвойте им номера - и тогда каждое новое поле будет получать соответствующий номер, и вставать в списке полей на желаемое место в иерархии расчетов. Кроме прочего, теперь даже без погружения в каждое конкретное поле вы сможете понять, куда надо внести исправление. 

После того, как основные расчеты будут написаны - создайте для них соответствующие папки. Компактность - наш лучший помощник.

На самом деле, иногда бывает уместно и папкам с исходниками дать какую-то нумерацию. Или a, b, c символы, чтобы добиться правильного порядка.

Да, если вам нужно выводить названия полей в визуализации - нумерация на уровне папки может быть предпочтительней нумерации на уровне поля, чтобы не озадачивать пользователей лишний раз.




В случае, если ваши этапы параллельны - добавьте уровень нумерации вроде 1.1, 1.2, и тогда вам будет понятно, что логика ветвится на этом конкретном шаге. В целом, имена однотипных полей должны начинаться одинаково, вы облегчите себе работу и в плане поиска, и в плане дальнейшей сборки последующих калькуляций. Это довольно крутая штука, когда в следующем уровне калькуляции можно копипастить, и при корректировке в названии поля достаточно исправить только окончание. Но здесь нужно быть особенно внимательным :)


4. Создайте валидационный лист

Итак, теперь, когда вы разбили свою логику на небольшие фрагменты и пронумеровали свои вычисления, чтобы упростить управление ими, как вы будете это всё тестировать? Зачастую, аналитики сразу начинают создавать чарты и добавлять фильтры на основе получившихся вычислений и группировок. Но гораздо надежнее будет не бросаться сразу в огонь - чарты прекрасны сами по себе, и порой процесс визуализации захватывает нас, кружит голову и отвлекает от проверки точности расчетов. 

Вместо этого стоит начать с создания таблицы. Да-да, таблицы правят миром - а вы еще спрашиваете, почему пользователи просят у нас именно их? 

Например вот так:


источник: https://www.flerlagetwins.com/2021/09/complicated-calcs.html


Это, конечно, выглядит жутковато. Но если не оставлять этот этап на сладкое, а последовательно добавлять расчеты в таблицу - вы сможете легко убедиться, что они соответствуют вашим ожиданиям. Именно это позволит вам поймать ошибку на одном из вложенных слоев и не потащить ее дальше.

Кроме того, этот валидационный лист может работать в качестве иллюстрации для промежуточных встреч с заказчиком - опять же, потому, что люди традиционно любят таблицы, вы повысите доверие к логике и отчету в целом, если каждый шаг этой логики будет явно виден. Конечно, это работает только в тех ситуациях, когда заказчик настроен на такой уровень погружения в процесс, и не падает в обморок от сотен цифр на экране.

5. Прокомментируйте расчеты прямо в полях

Мы все этим пренебрегаем в большей или меньшей степени, скорее в большей, но если вы реализуете сложный расчёт - убедитесь, что вы прокомментировали свои вычисляемые поля. 

Основных причин две. 

Первая причина - после выпуска отчета в продакшен может пройти значительное время, прежде чем вам снова понадобится внести какое-то изменение. Практика показывает, что восстановить даже свою собственную логику спустя месяцы и даже недели бывает непросто, особенно если применялись какие-то исключения или специфические модификации. Назначение расчетов, закрепленное в комментариях - это иногда еще и экономия времени при создании внешней документации

Вторая причина вытекает из первой - однажды вы будете передавать этот отчет коллеге, или сами получите отчет в наследство от другого человека. При передаче знаний вы можете столкнуться с нашей первой причиной и по ходу трансфера знаний мучительно вспоминать, что же было задумано. Если же человек получает легаси без доступа к телу разработчика - без комментариев процесс расследования займет куда больше времени. Совсем не обязательно замахиваться на лавры Толстого - будьте понятны сами себе, и всё будет хорошо. Вы помните, нас мало - пожалейте нервные клетки представителей Tableau комьюнити :)




Не стесняйтесь. Комментарии это не показатель вашей неуверенности в себе, это показатель профессионализма. К тому же, истории известны примеры приятных пасхалок и даже любовной милейшей переписки в комментариях к калькуляциям. 

Еще одной малоиспользуемой (напрасно!) фичей является Comment, который можно добавить через настройки поля по умолчанию. Скажем так, путь добавления этого описания не самый быстрый - но зато вы сможете видеть комментарий, не заходя в поле. Даже если просто скопипастить туда текст, который вы уже написали внутри калькуляции - это помогает.




Итог

Теперь мы умеем делить, структурировать и раскладывать - вполне классическое определение анализа. Этот лонгрид во многом вдохновлен содержанием очень классного англоязычного поста, но я сдобрила его приличным куском отсебятины. Отвашатина, как всегда, приветствуется - буду рада, если поделитесь вашими идеями, как еще можно сделать процесс создания расчётов в Tableau и других BI тулах проще и приятнее ;)

Источник: https://habr.com/ru/post/648233/

Последние статьи в блоге

Платформа сертификации IBS признана лучшим digital-решением для корпоративного обучения

Центр сертификации IBS стал обладателем Гран-при премии «Смарт пирамида» — одной из самых престижных российских премий за достижения в области обучения и развития человеческого капитала.

20 декабря 2024

Учебный центр IBS получил сертификат ГОСТ Р ИСО 9001-2015

В октябре 2024 года Учебный центр IBS получил сертификат соответствия ГОСТ Р ИСО 9001-2015. Это важное достижение подтверждает, что мы придерживаемся высоких стандартов качества и результативно управляем образовательными процессами организации.

19 декабря 2024

9 курсов со скидкой до 50%

Друзья, в январе стартует 9 курсов, обучение на которых можно купить со скидкой до 50%*! 

15 декабря 2024

8 заблуждений про тестирование

Тестирование программного обеспечения окружено множеством заблуждений. Эти стереотипы нередко приводят к недопониманию его реальной роли и важности для успешного создания продуктов. Рассмотрим восемь самых распространенных мифов о тестировании и объясним, почему они не соответствуют действительности.

15 декабря 2024

Путь к Fullstack-тестировщику: что нужно знать о ручном и автоматизированном тестировании?

Тестирование программного обеспечения — одна из самых востребованных областей в IT. И часто новички и даже опытные специалисты, желающие строить свою карьеру в этом направлении, часто сталкиваются с вопросом: какое тестирование выбрать — ручное, автоматизированное или Fullstack? У каждого из этих направлений свои особенности, преимущества и требования к знаниям. В этой статье рассмотрим каждое из направлений, их плюсы и минусы, области применения и навыки, необходимые для успеха.

15 декабря 2024

Совет по развитию сертификации ИТ-специалистов при АПКИТ аккредитовал «Платформу сертификации IBS»

Директор департамента обучения и развития IBS Владимир Гернер участвовал в заседании Совета по сертификации ИТ-специалистов при АПКИТ.

Новости Жизнь компании
08 октября 2024

Java-сертификация: IBS в сравнении с Oracle

Игорь Судакевич рассказывает, почему сертификаты могут стать важным инструментом для достижения карьерных целей.

Новости
04 октября 2024

Исследование IBS: число новых ИТ-решений в реестре ПО выросло в 2023 году более чем на треть

Анализируем ситуацию на рынке российского ПО.

Жизнь компании
01 октября 2024

6 суперспособностей Fullstack-тестировщиков, которые напоминают навыки животных

Читайте о скиллах, которые делают тестировщиков востребованными на рынке труда.

27 сентября 2024

5 мифов о системных аналитиках

Вместе с Екатериной Тихомировой, специалистом по системному и бизнес-анализу, разбираемся, чем занимаются системные аналитики.

20 сентября 2024

Методология 12 факторов: как успешно разрабатывать облачные приложения

Андрей Бирюков рассказывает о методологии, которая помогает разрабатывать качественные, устойчивые и эффективные веб-приложения.

12 сентября 2024

Баги, которые стали фичами

Многие вещи, которые мы используем ежедневно, были случайно открыты. В честь дня тестировщика рассказываем про 5 багов, которые стали фичами.

09 сентября 2024

Шаблоны облачного проектирования

Читайте про наиболее популярные шаблоны облачного проектирования: шаблон Bulkhead и шаблон Sidecar.

06 сентября 2024

Бесплатные мини-курсы ко Дню знаний

Друзья, поздравляем с Днём знаний! Желаем любопытства, открытий и новых побед!

02 сентября 2024

5 курсов со скидкой 30%

Друзья, в сентябре стартует 5 курсов со скидкой 30%*

29 августа 2024

Исследование IBS: на одну вакансию в Java-разработке приходится 4 резюме

По данным исследования рекрутингового центра IBS, наибольшая конкуренция среди соискателей наблюдается среди Python-разработчиков: на одну вакансию приходится 10 резюме. В менее конкурентной среде находятся Java-разработчики (4 резюме на одну вакансию). Самыми дефицитными являются специалисты по языку Go: менее 2 резюме на одну вакансию.

28 августа 2024

Индексирование баз данных в PostgreSQL: погружение в тему

В продолжение серии статей об устройстве системы управления базами данных (СУБД) PostgreSQL (раз, два) смотрим, как ускорить выполнение запросов к базе данных с помощью индексов.

28 августа 2024

Книги для системных и бизнес-аналитиков, а также будущих и нынешних архитекторов

Наш коллега, архитектор информационных систем Сергей Политыко, поделился полезными книжными рекомендациями.

Жизнь компании
19 августа 2024

Сценарии кибератак с использованием ИИ. Внутренний периметр.

Кибератаки, направленные на внутренние периметры организаций, становится особенно актуальной темой. Внутренние атаки могут происходить как от злоумышленников с доступом к ресурсам, так и извне, используя уязвимости внутренней инфраструктуры. Использование ИИ в таких атаках позволяет автоматизировать и улучшить процесс поиска уязвимостей, создать вредоносный код и разработать методы социальной инженерии, что увеличивает скорость и масштаб атак. Расскажем про сценарии таких атак подробнее.

16 августа 2024

Сценарии кибератак с использованием ИИ. Внешний периметр

Сценарии кибератак по внешнему периметру представляют собой модели и методы, которые злоумышленники используют для незаконного доступа к информационным системам и данным компаний через их внешние интерфейсы и сети. Это как если бы ваша компания была неприступной крепостью, а за ее воротами стояла бы армия хорошо обученных солдат-магов, которые способны разрушить крепость по щелчку пальцев. Вы уверены, что ваши высокие стены и глубокие рвы вас спасут от подобной армии?

09 августа 2024

Не нашли, что искали? — Просто напишите, и мы поможем

Продолжая, я подтверждаю, что ознакомлен с Условиями использования и Порядком обработки персональных данных
Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.