Pull to refresh

Comments 13

А как вы решили проблему джойнов таблиц?

Пока никак =) На слое данных это не проблема, в arquero есть полный комплект джойнов, но много интерфейсной работы (переключение таблиц, мульти-табличные пайплайны и всё такое). Задача в топе на развитие.

Что-то у меня не заработал "start with" по полю country.
А так классная вещь я думаю, вот только переучиваться с двойного клика по csv когда открывается эксель на что-то иное - тяжело. Так что я подожду внедрения duckdb, чтобы иметь больше мотивации.

Спасибо за багрепорт, исправил! Думаю, перед дальнейшим развитием хорошо бы намазать тестов =)

DuckDB мотивирует SQL-синтаксисом или чем-то еще?

Да, но в большинстве в генерации новых данных, т.е. какие-то формулы над данными и прочее.

Отлично, +1 и :star:, действительно удобный инструмент для уже нормализованных (очищенных) данных в одной таблице. На эту роль годятся 1С-проводки, логи, журналы итп.

Интерактивная пошаговая агрегация позволяет мыслить "срезами" данных, а всегда доступная сортировка результата дает простой взгляд на существенное и мелкое. Локально, правда, не запустилось, в логе error Missing script: "ci" - но это, полагаю, из-за моего старья Win7/node v16.6.2/npm v7.20.3

Спасибо за отзыв! С локальным запуском мой косяк, имелся в виду npm ci (без run) — обновил ридми.

UFO just landed and posted this here

Ну или хотя бы среднего и полезного) Спасибо!

Но чем простому парню вроде меня поковыряться в данных? Есть 3 варианта, но все они так себе

А Yandex DataLens? Мощная и бесплатная BI-система. И ничего кодить не надо :).

Интерактивности маловато, на датасете in-memory размера хочется поиграться с параметрами и чтобы таблица менялась в реальном времени.

Параметры есть, и в реальном времени будет всё меняться. Причём не только таблица, но и куча разных графиков.

Хмм, на самом деле не думал про BI системы для этой задачи! Тогда сегментируемся так, hippotable:

  • Просто использовать: просто открываешь файл и работаешь, не надо плясать с подключениями, датасетами, чартами.

  • Работает действительно быстро из-за отсутствия клиент-серверности.

  • Простой деплой on-premises.

  • Почти неограниченная нагрузка с низкими операционными костами (S3 по цене грязи).

При этом:

  • Ограниченный размер датасета

  • Меньше источников данных и интеграций

Sign up to leave a comment.

Articles