Comments / Profile of pvdubinin / Habr

Павел Дубинин @pvdubinin

User

Анализ навыков data-специализаций в вакансиях HH.ru

pvdubinin Apr 8 2024 at 16:43

А почему mobile версия отдельно? В настройках дашборда DataLens можно указать порядок отображения ленты при мобильной верстке:

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Oct 4 2023 at 12:23

А в какие лимиты уперлись и в каком кейсе? Про лимиты и производительность писал чуть выше

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Oct 2 2023 at 07:32

Скоро будет инструкция для этого

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 30 2023 at 19:22

Примеры с кластеризацией точек на карте можно посмотреть на демодашборде в облачном DataLens. В open source карты будут доступны чуть позже.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 28 2023 at 13:58

Да, эти же лимиты описаны в документации open source проекта: https://datalens.tech/docs/ru/concepts/limits.html

Важно, что эти лимиты именно про отображение на чарте (например, отобразить 75001 столбец на одном чарте уже не получится, но оно обычно и не имеет смысла). Сырых данных под чартом может быть сколько угодно - в этом ограничений нет (например, вывести сумму продаж по 100 продуктам за всю историю 2млн фактов продаж - не проблема).

В этой статье рассматривали кейс и производительность дашборда на таблице с 150млн строк https://habr.com/ru/companies/yandex_cloud_and_infra/articles/746022/

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 28 2023 at 09:45

О причинах ограничений писали в посте. Вывод cloud-native сервиса в опенсорс — большой проект. Не все компоненты Yandex Cloud возможно вынести в опенсорс. Где-то нам удалось избавиться от зависимостей, а что-то еще предстоит. Вы про какую платную версию?

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 28 2023 at 09:22

1) Есть вычисляемые поля. В документации есть описание функций и туториалы по их использованию.

2) Если речь про новые типы чартов, то готового API/SDK для этого пока нет. Но весь исходный код открыт, поэтому при большом желании можно разобраться в том, как все устроено и сделать pull-request с новым функционалом.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 27 2023 at 12:18

Да, создаете обычный чарт Сводная таблица. В нее можете накидывать измерения и показатели, добавлять итоги / подытоги, включать условный формат и индикаторы, а также многое другое.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 27 2023 at 12:12

Коннектор к MS SQL уже есть в облачном DataLens. В open source список подключений также планируем расширять. Для некоторых подключений есть лицензионные нюансы используемых библиотек, поэтому не можем выложить все сразу.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 27 2023 at 12:05

Исправляюсь:

Серия роликов про концептуальное сравнение DataLens с PowerBI / Tableau / Superset

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 27 2023 at 12:01

Действительно, DRILL_TO_DETAIL появился в Superset недавно, но пока еще в статусе Testing, а по умолчанию в опенсорсе даже выключен. А parent-child иерархий с частичным раскрытием по клику на "+". так и нет(

В DataLens при описании модели данных можно использовать свой синтаксис для конструктора формул: оконные функции, time-series, LOD'ы, функции по работе с массивами - все это в зависимости от самого чарта, набора измерений и группировок - может транслироваться в разные SQL подзапросы с учетом специфики/синтаксиса конкретного источника. А в Superset, для агрегации сложнее обычной SUM/COUNT - уже нужно писать Custom SQL.

Вообще, детальное сравнение инструментов - тема отдельной статьи)

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 27 2023 at 11:37

В вашем примере для повышения плотности можно:

убрать подписи осей (sales и Order month)
убрать легенду
убрать подписи значений по оси Y (и добавить подписи на сам график, например)
убрать лишние заголовки
не использовать иерархию и drill-down, в этом случае не будет и хлебных крошек навигации по ней

Все это делается кликами в настройках чарта, см. пример на основе того же дашборда:

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 26 2023 at 16:13

Коннектор к Oracle есть в облачном DataLens. С точки зрения публикации его в open source есть лицензионные нюансы. Сейчас юристами прорабатываем варианты, как их обойти.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 26 2023 at 16:06

В этой серии роликов Рома Бунин делал концептуальное сравнение DataLens с PowerBI / Tableau / Superset.

Из того что можно отметить сходу у DataLens можно выделить:

Нативную работа с Clickhouse (для нас основной источник)
Lod'ы, оконные другие аналитические функции
Иерархии и дрилл-даун из измерений

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 26 2023 at 15:56

Потенциально возможны коммерческие проекты внедрения и платная поддержка

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 26 2023 at 15:55

Список коннекторов в опенсорсе будет расширяться. Коннектор к CSV требует дополнительного механизма кэширования, поэтому добавим его чуть позже.

Look

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

pvdubinin Sep 26 2023 at 10:31

1) Открытая лицензия Apache 2.0, про это написано в первом предложении статьи и на Github: https://github.com/datalens-tech/datalens/blob/main/LICENSE

2) Они часто зависят от конкретных требований ИБ внутри компании. В целом - при большом желании можно прикрутить собственную систему аутентификации/авторизации уже сегодня. В будущем, конечно, мы предложим и готовые решения и API/SDK для удобной интеграции с корпоративными системами.

3) Ничто не мешает развернуть DataLens Open Source в закрытом контуре без подключения к интернету уже сейчас.

+12

Look

Исследование рынка российских (и не только) BI-платформ

pvdubinin Nov 5 2022 at 12:44

Интересно по Visiology получается:

Встроенных инструментов ETL в Visiology нет. Данные лучше подготовить заранее на уровне СУБД или других ETL-инструментах.

и дальше:

а обработку данных необходимо проводить на Python, либо выносить на сторону СУБД"

А в сводной таблице - указано что встроенный ETL есть и стоит галочка.

Отсутствуют возможности по настройке всплывающих окон

А в сводной таблице по этому пункту стоит галочка.

Встроенный движок позволяет агрегировать данные (sum, count и т.п.), а также выполнять несложные расчеты…для более сложных вычислений необходимо использовать Python.

А в сводной таблице в разделе “Контекстные вычисления” стоит галочка.

Look

Исследование рынка российских (и не только) BI-платформ

pvdubinin Nov 2 2022 at 16:23

Спасибо за обзор! Круто, что для изучения DataLens вам не пришлось обращаться к вендору:)

Пара комментариев:

Необходимо принимать во внимание, что Яндекс DataLens поставляется только в комплекте с Яндекс Облаком

Yandex DataLens можно использовать совершенно бесплатно, без каких либо ограничений (на число пользователей, объем данных в источнике итп.) даже в отрыве от Yandex Cloud. Можно подключаться и работать со своими БД (на своих серверах или других облаках).

Нужно принимать во внимание отсутствие функционала по настройке условного форматирования

Условный формат уже есть: https://t.me/YandexDataLens/25715

Look

Как ГЛОНАСС испортил мне кровь и причем тут BI

pvdubinin Sep 2 2022 at 08:15

A DataLens смотрели? Недавно про него как раз был пост: https://habr.com/ru/post/674038/

Look