Pull to refresh

Comments 5

Делал на похожем стеке pet -project, только вместо superset был metabase, для экономии места на VPS. В итоге столкнулся с двумя моментами. 1. Периодически нужно чистить логи от airflow, т.к шедулер быстро накапливает мусор. 2. Почему-то оператор отвечающий за парсинг перестал работать на VPS спустя недедю, хотя использую замену заголовков как и при запуске просто с ноута( без проксирования). В целом очень рабочий стек!

Привет, вспомнил креды от ака что бы написать ответ.

Мы в компании развернули Airbyte который льет в Clickhouse подключенный к Metabase. До этого пользовались Metabase подключенным к главной Постгрес БД и были счастливы. Но захотели все в одном ДатаВарехус.

С чем столкнулись - Метабейс не режет JSON который лежит в столбце Clickhouse на отдельные столбцы, в отличие от Постгрес БД.

В Аербайт же Т (трансформ) - платная фича. Очень дорогая. У них он Мапинг называется.
Т.е. ни резать Json ни изменять типы поля я там не могу.

У нас компания не ИТ, выделенных датааналитиков нет, делаю методом тыка все.
В итоге сейчас имеем собранную в кликхаус информацию со всех усюд, но использовать ее в метабейсе корректно не можем.

Посоветуйте куды бы вы копали на моем месте?

А что вы имеете в виду под "Метабейс не режет JSON который лежит в столбце Clickhouse на отдельные столбцы"? Метабейс сам ничего не должен резать.

Почему бы вам не разбирать JSON в SQL-запросе средствами clickhouse? У clickhouse много функций на эту тему: https://clickhouse.com/docs/sql-reference/functions/json-functions

вы правы, мы уже сами дошли до этого подхода

метабейс умеет автоматом разрезать json у Mysql подобных бд, очень удобно. В таблицах показывает их как отдельные столбцы.

Sign up to leave a comment.

Information

Website
beget.com
Registered
Founded
Employees
201–500 employees
Location
Россия