thoughtspile Dec 27 2023 at 08:42

Hippotable — анализ данных прямо в браузере

Easy

5 min

948

JavaScript * Data Mining * Open data * Statistics in IT

+15

Comments 13

khailo Dec 27 2023 at 09:17

А как вы решили проблему джойнов таблиц?

thoughtspile Dec 27 2023 at 09:28

Пока никак =) На слое данных это не проблема, в arquero есть полный комплект джойнов, но много интерфейсной работы (переключение таблиц, мульти-табличные пайплайны и всё такое). Задача в топе на развитие.

freeExec Dec 27 2023 at 09:42

Что-то у меня не заработал "start with" по полю country.
А так классная вещь я думаю, вот только переучиваться с двойного клика по csv когда открывается эксель на что-то иное - тяжело. Так что я подожду внедрения duckdb, чтобы иметь больше мотивации.

thoughtspile Dec 27 2023 at 09:57

Спасибо за багрепорт, исправил! Думаю, перед дальнейшим развитием хорошо бы намазать тестов =)

DuckDB мотивирует SQL-синтаксисом или чем-то еще?

freeExec Dec 27 2023 at 10:27

Да, но в большинстве в генерации новых данных, т.е. какие-то формулы над данными и прочее.

economist75 Dec 27 2023 at 09:51

Отлично, +1 и :star:, действительно удобный инструмент для уже нормализованных (очищенных) данных в одной таблице. На эту роль годятся 1С-проводки, логи, журналы итп.

Интерактивная пошаговая агрегация позволяет мыслить "срезами" данных, а всегда доступная сортировка результата дает простой взгляд на существенное и мелкое. Локально, правда, не запустилось, в логе error Missing script: "ci" - но это, полагаю, из-за моего старья Win7/node v16.6.2/npm v7.20.3

thoughtspile Dec 27 2023 at 10:03

Спасибо за отзыв! С локальным запуском мой косяк, имелся в виду npm ci (без run) — обновил ридми.

UFO landed and left these words here

thoughtspile Dec 28 2023 at 08:04

Ну или хотя бы среднего и полезного) Спасибо!

dedmagic Dec 28 2023 at 04:53

Но чем простому парню вроде меня поковыряться в данных? Есть 3 варианта, но все они так себе

А Yandex DataLens? Мощная и бесплатная BI-система. И ничего кодить не надо :).

thoughtspile Dec 28 2023 at 05:27

Интерактивности маловато, на датасете in-memory размера хочется поиграться с параметрами и чтобы таблица менялась в реальном времени.

dedmagic Dec 28 2023 at 05:29

Параметры есть, и в реальном времени будет всё меняться. Причём не только таблица, но и куча разных графиков.

thoughtspile Dec 28 2023 at 08:03

Хмм, на самом деле не думал про BI системы для этой задачи! Тогда сегментируемся так, hippotable:

Просто использовать: просто открываешь файл и работаешь, не надо плясать с подключениями, датасетами, чартами.
Работает действительно быстро из-за отсутствия клиент-серверности.
Простой деплой on-premises.
Почти неограниченная нагрузка с низкими операционными костами (S3 по цене грязи).

При этом:

Ограниченный размер датасета
Меньше источников данных и интеграций