Визуализация данных *

Облекаем данные в красивую оболочку

СтатьиПостыНовостиАвторыКомпании

VictorVangeli 13 мар в 11:58

Obsidian: все что нужно знать о Callout

Простой

13 мин

18K

СофтВизуализация данных * CSS * Хранение данных *

Туториал

В этой статье я подробно расскажу о возможностях использования Callout в Obsidian, покажу существующие решения, а также объясню, как создавать свои собственные, индивидуальные типы Callout-блоков.

Рассмотрим при чем здесь цитаты (Blackquotes).

Дополнительно поделюсь полезными надстройками и шаблонами

+43

iamrozanov 13 мар в 11:00

Чужое открытое ПО внутри BI-систем: проблемы лицензирования, о которых не все задумываются

5 мин

Блог компании Luxms BIВизуализация данных * Big Data * Анализ и проектирование систем * Open source *

Мнение

Для быстрого создания какого-то продукта часто используют различные open source решения. Но применение открытого ПО несёт в себе определённые риски: от финансовых до юридических. Потому что разработка на базе ПО с открытым исходным кодом не означает бесконтрольное использование созданных на этом коде продуктов из-за действия соответствующей лицензии: BSD, GNU, MIT, LGPL, AGPL, BSPL, SSPL, Demoware License, Apache License 2.0, RSAL и других. А в соответствии со статьями 1252 и 1301 ГК РФ иски о нарушении лицензионного права предъявляются к юридическому лицу, использующему указанное программное обеспечение.

Меня зовут Алексей Розанов, я руководитель пресейл-направления и работы с партнёрами ГК Luxms, и в этой статье я хочу рассмотреть несколько примеров использования open source решений на рынке BI-аналитики и подсветить юридические риски для компаний, которые используют BI-системы на их основе.

LastSoviet 11 мар в 21:00

Неизвестный библейский алгоритм кластеризации

Средний

6 мин

6.9K

Визуализация данных * Машинное обучение * Научно-популярноеАлгоритмы *

Из песочницы

Времена, когда горящий куст мог принести озарение, давно прошли. Примитивный опыт уже не может стать источником открытий. А всё потому, что он обобщён и впитан в культуру человечества. И чтобы подключиться к мудрости предков нужно опереться на философию. В этой статье мы познакомимся с новым алгоритмом кластеризации и поверхностно затронем некоторые философские категории. Перевернём объективность в субъектность и обратно.

+38

gmtd 11 мар в 04:52

Lissa Health — приложение для хранения личной медицинской информации (v1.2)

3 мин

809

Искусственный интеллектVueJS * Визуализация данных * ЗдоровьеБиология

Обновилось приложение для хранения личной медицинской информации "слэш" персональный AI-помощник Lissa Health.

Мы добавили загрузку и распознавание результатов лабораторных анализов в виде изображений, возможность загрузки вложений в документ, экспорт данных пользователя в JSON и кое-что еще.

Подробности ниже.

ekhavronina 10 мар в 06:01

Оптимизация дашбордов в Superset

Средний

10 мин

4.5K

Блог компании ГазпромбанкData Engineering * SQL * Визуализация данных *

В этой статье я бы хотела поделиться опытом в оптимизации дашбордов в Apache Superset. Мы в Газпромбанке перешли на этот BI-инструмент относительно недавно. В основном мы работаем в нем с движком Impala.

Иногда бывает так, что некоторые дашборды загружаются дольше других, роняют страницу в браузере или даже замедляют работу для других пользователей на кластере.

У коллег накопился большой опыт в оптимизации SQL-запросов (о чем недавно также вышла статья) и в стандартах разработки витрин. Но конкретно в работе с построением дашбордов есть своя специфика, которая не всегда учитывается, когда речь заходит об оптимальности работы. Superset так же проводит все расчеты на стороне источника через запросы к БД, как это происходит в обычных IDE. Только он преобразует конечный результат в графики, что скрывает от наших глаз сложные запросы, которые иногда там формируются.

Ниже мы рассмотрим, как можно оптимизировать работу с датасетами, графиками и содержанием дашборда, а также как ускорить загрузку с помощью агрегированных таблиц.

Читать дальше →

avshkol 7 мар в 21:56

Цифровизация чувств: упаковываем эмоции в датафрейм или базу данных

Простой

52 мин

1.9K

Python * Будущее здесьВизуализация данных * Искусственный интеллектКиберпанк

Кейс

Эмоций, чувств и их оттенков много, они разные, и чтобы во всём этом разобраться, соберем их... в базу данных или датафрейм. Заодно установим связи между эмоциями, а также попробуем оценить разные числовые «эмоциональные коэффициенты»... Имея такую базу данных, мы сможем научить LLM (да и самих себя!) распознавать эмоции и их оттенки, лучше понимать человека. В этой статье описываются практические моменты создания такого «датафрейма эмоций». Важно упомянуть, что такую работу автор смог проделать только благодаря нескольким LLM, работа с которыми на порядки сократила объем работы по сбору и обработке информации (но текст статьи я писал по‑старинке — руками...)

qlever 7 мар в 12:09

Зачем бизнесу нужно DWH и как обосновать необходимость проекта? Можно ли оценить окупаемость хранилища?

9 мин

2.7K

Хранение данных * Визуализация данных * Big Data *

Проекты внедрения DWH относятся к трудоемким и всегда требуют вложений, стоимость проектов начинается от 1,5 млн руб.

К проекту необходимо привлекать системных аналитиков, архитекторов DWH, разработчиков, DevOps, дата-инженеров. Кроме затрат на ФОТ, нужны бюджеты на инфраструктуру и технологии, так как готового решения DWH из "коробки" не существует.

Как при таких затратах аргументировать для бизнеса необходимость внедрения DWH? Какие бизнес-задачи может решить хранилище данных? Можно ли оценить окупаемость и эффективность внедрения? Читайте в статье.

Marwin 6 мар в 08:42

Как превратить сырые данные в аналитический отчет

Простой

10 мин

2.3K

Визуализация данных * Программирование * C# * Data Mining * MongoDB *

Туториал

Делюсь опытом и готовыми решениями по сбору и структурированию сырых данных, превращая их в полезный инструмент для аналитиков.

PatientZero 4 мар в 06:41

Проблема Deep Research

Простой

6 мин

3.6K

Искусственный интеллектМашинное обучение * Визуализация данных *

Аналитика

Перевод

Deep Research компании OpenAI создан для меня, но я не могу им пользоваться. Это ещё одно потрясающее демо, увы, поломанное. Но ломается оно очень интересным образом.

По большей мере я зарабатываю на жизнь исследованиями и анализом. Я думаю о данных, которые хочу увидеть, и ищу их; собираю и сопоставляю их, создаю графики, решаю, что они скучные, и пробую снова, нахожу новые способы и новые данные для понимания и объяснения проблемы, пишу текст и составляю графики, пытаясь выразить то, что я думаю. А потом я разговариваю об этом с людьми.

При этом часто требуется большой объём ручного труда: под каждым графиком скрывается айсберг. И похоже, Deep Research предназначен именно для меня. Подходит ли он под мои задачи?

Я могу протестировать его на новой задаче, но прежде чем тратить время и кредиты, к счастью, можно воспользоваться образцом отчёта со страницы OpenAI. Этот отчёт посвящён тому, что я достаточно хорошо изучил — смартфонам. Давайте исследуем его.

+21

VictorVangeli 3 мар в 13:15

Obsidian: Типы данных

Простой

14 мин

23K

Canvas * Визуализация данных * СофтХранение данных *

Из песочницы

Этой статьей я хотел бы начать серию обучающих материалов, в которой поделюсь всем, что мне известно про редактирование текста и организацию работы в Obsidianи с Markdown файлами.

Покажу интересные способы использования markdown заметок для решения разных задач.

+75

Andchir 3 мар в 09:21

api2app: Как из домашнего компьютера сделать сервер для публичного приложения

Простой

7 мин

5.1K

Python * Искусственный интеллектВизуализация данных * Интерфейсы *

Туториал

Ранее я уже рассказывал, что при разработке api2app вдохновлялся идеей Python-библиотеки Gradio. У этой библиотеки есть очень полезный функционал: можно запустить приложение на локальном компьютере в режиме share (поделиться), тогда будет сгенерирована публичная ссылка, по которой это приложение будет доступно на любом другом компьютере, подключенном к Интернет.

В этой статье пошагово опишу свой способ. Есть свои плюсы и свои минусы, но в любом случае, думаю, альтернатива не будет лишней. Для примера создам онлайн-приложение для создания транскрипций аудио с помощью проекта whisper.cpp. Делаю всё на Ubuntu, но, думаю, на Windows это повторить будет не сложно.

dan_sw 2 мар в 18:53

Исследование набора данных для обучения LVLM — SeeClick (Web Data)

Средний

13 мин

488

Python * Визуализация данных *

Обзор

В данной статье будет рассмотрен набор данных для обучения LVLM (Large Visual Language Model), который использовался авторами статьи "SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents" при обучении модели SeeClick, которая показывает достаточно неплохие результаты, по сравнению с аналогичными решениями. Рассмотрен будет только набор данных, который использовался при обучении SeeClick для определения элементов на веб-страницах, полученный авторами этой модели с помощью Common Crawl (открытый репозиторий набора данных о веб-страницах).

Данная статья может быть полезна специалистам, которые начинают разрабатывать свою LVLM работающую со скриншотами пользовательского экрана (image-ориентированные), а не с содержимым HTML веб-приложения (text-ориентированные). В статье будет рассмотрена базовая работа с частью предоставляемого SeeClick набора данных (10000 размеченных изображений общим объёмом в 4.8 Гб).

koanse 2 мар в 13:30

Использование dax.do для произвольной схемы данных на основе перевода DAX в Contoso через Telegram бот

3 мин

734

Визуализация данных * Big Data * Искусственный интеллект

Кейс

Привет, Хабр! В работе Business Intelligence аналитика могут встречаться задачи проверки DAX запроса на произвольной схеме, к которой может не быть доступа. Перевод DAX запроса из исходной схемы в схему, к которой есть доступ и есть возможность выполнения DAX запроса, может занимать некоторое время и требовать определенных усилий. В век AI, безусловно, хочется делать перевод в схему автоматически, при помощи AI. Кроме того, ресурс dax.do является достаточно удобной песочницей для Contoso схемы данных, поэтому такое впечатление, что одним из быстрых решений для анализа и запуска DAX без схемы данных является перевод произвольного DAX в dax.do (например, автоматически при помощи Telegram бота), что позволяет уже дальше смотреть полученный DAX в песочнице dax.do на схеме Contoso без каких-то ограничений. Это позволяет проверить работоспособность DAX на незнакомой схеме за секунды. Интересующимся новыми возможностями DAX песочниц — добро пожаловать под кат :)

OlegSivchenko 27 фев в 18:49

Визуальная история. Как инфографика меняет подход к данным. Guest Post

12 мин

2.4K

Привет, Хабр!

Мне очень понравились ваши отклики на одну из моих недавних статей «Не трогай моих чертежей! История науки в знаменитых изображениях» (и ваша высокая оценка +43), поэтому я какое‑то время подумывал продолжить эту тему большой статьёй об инфографике. Но время шло, и за помощью по этой теме я обратился к уважаемой Анастасии Лазукиной @anastasiamrr, ранее писавшей для этого блога отличные гостевые посты. На Хабре Анастасия сотрудничает с корпоративным блогом FirstVDS, где пишет замечательные материалы с выраженной биореакторной спецификой. Подписывайтесь на неё, следите за обновлениями, а пока заходите под кат. Далее — от автора.

+12

EvgeniiSA 27 фев в 10:54

ТОП 6 фишек Zabbix: применение и настройка

Простой

7 мин

16K

Блог компании Банки.руIT-инфраструктура * Системное администрирование * Визуализация данных *

Обзор

✏️ Технотекст 7

Всем привет! Меня зовут Женя. Я инженер поддержки бизнес-приложений в компании Банки.ру.
Не так давно мы в направлении Мобайл решили прокачать технический и продуктовый мониторинг и с этой целью начали использовать Zabbix. В результате всю логику алертинга перенесли из Grafana в новый инструмент. Благодаря этому и родилась идея поделиться опробованными фишками Zabbix с сообществом.

В этой статье я:

• расскажу об интересных возможностях Zabbix;
• поделюсь кейсами их использования и примерами настроек;
• сравню Zabbix и Grafana и расскажу, как мы применяем их в тандеме.

Информация будет полезна продуктовым командам, которые используют только Grafana для визуализации сервисных метрик и алертинга, но хотят масштабировать и развивать свой мониторинг.

Читать далее!

+14

koanse 26 фев в 08:57

Возможности комбинаторов в ClickHouse

9 мин

2.1K

Блог компании VisiologyВизуализация данных * Big Data * SQL *

Кейс

Что делать с запросами к СУБД, выполнение которых затягивается на десятки минут, как можно оптимизировать вложенные операторы, чтобы получить нужные данные за секунды? За счет чего подобные операции выполняются в Visiology автоматически? Ответы на эти вопросы мы попробуем дать сегодня на примере небольшого синтетического теста со сложным SQL-запросом, и разберемся при чем тут комбинаторы в ClickHouse. Эта статья будет полезна тем, кто интересуется SQL-оптимизаторами, а также всем существующим и будущим пользователям Visiology, кто хочет заглянуть под капот системы. Если вы из их числа, добро пожаловать под кат :)

PatientZero 26 фев в 08:29

«Чем ближе к вокзалу, тем хуже кебаб?»: «исследование»

Простой

10 мин

8.9K

Python * Проектирование API * Визуализация данных * Геоинформационные сервисы * Программирование *

Аналитика

Перевод

Во французском сабреддите я наткнулся на пост с интересной гипотезой:

Чем ближе точка к вокзалу, тем хуже там кебаб.

Пост на французском привлёк достаточно большое внимание, учитывая относительно небольшой размер сабреддита; это доказывало, что многие с ним согласны. Впрочем, в комментариях были и критики, рассказывающие истории, противоречащие сформулированной гипотезе.

Я решил, что мне нечем заняться, ведь я вылетевший с учёбы выгоревший безработный с новоприобретённым диагнозом «аутизм», поэтому стоит пожертвовать немного своего времени на благую цель — проведение этого неформального «исследования». В пределах следующих трёх рабочих дней мне на почту точно придёт Нобелевская премия мира и куча рабочих офферов.

+76

techno_mot 26 фев в 08:00

Почему observability — это не только Grafana и Prometheus

11 мин

12K

Блог компании SelectelСистемное администрирование * Серверное администрирование * Визуализация данных * DevOps *

Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена.

Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разберемся, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.

Читать дальше →

+80

finmap-org 26 фев в 03:07

Как я маркетдату агрегировал. Визуализация данных Nasdaq, LSE и MOEX

2 мин

525

Финансы в ITВизуализация данных * Open source * JavaScript * Data Mining *

В предыдущей статье я рассказал о finmap.org - инструменте визуализации данных Мосбиржи. Спасибо хабравчанам за отзывы и предложения. Отдельная благодарность за донаты - я уже покрыть расходы на AWS. Благодаря вашим идеям, в finmap.org появилась строка поиска по тикеру, а в portfolio можно отобразить американские ETF.

В новой версии опубликован исходный код Github Workflows, добавлены данные торгов Лондонской биржи. Датафайлы приведены к общему формату, это сильно упростило разработку. Отображение исторических данных в виде гистограммы теперь доступно для всех площадок.

ne555 24 фев в 15:22

С корабля на бал. Межконтинентальный заплыв из Азии в Европу (анализ данных в комплекте)

17 мин

1.4K

Читальный залЗдоровьеВизуализация данных *

Повествование пойдет о Босфорском боевике, который состоялся в 2016 году во времена Турецкого военного путча.

_{⋮ Дисклеймер.}
_{Материал опубликован из собственных очерков, которые были написаны, переписаны и убраны в стол. Во-первых, при случае удобно поделиться с кем-то ссылкой на свою историю, чем расчехлять черновики, во-вторых, присутствует}_{уникальный}_{материал (анализ данных), который любознательные читатели найдут только в этом лонгриде, и в третьих, продолжаю вдохновлять тех людей, кто ищет частичку мотивации.}

Мне нужна мотивация

1 2 ...

12 13

15 16 ...

98 99

Визуализация данных *

Obsidian: все что нужно знать о Callout

Чужое открытое ПО внутри BI-систем: проблемы лицензирования, о которых не все задумываются

Неизвестный библейский алгоритм кластеризации

Lissa Health — приложение для хранения личной медицинской информации (v1.2)

Оптимизация дашбордов в Superset

Цифровизация чувств: упаковываем эмоции в датафрейм или базу данных

Зачем бизнесу нужно DWH и как обосновать необходимость проекта? Можно ли оценить окупаемость хранилища?

Как превратить сырые данные в аналитический отчет

Проблема Deep Research

Obsidian: Типы данных

api2app: Как из домашнего компьютера сделать сервер для публичного приложения

Исследование набора данных для обучения LVLM — SeeClick (Web Data)

Использование dax.do для произвольной схемы данных на основе перевода DAX в Contoso через Telegram бот

Ближайшие события

Визуальная история. Как инфографика меняет подход к данным. Guest Post

ТОП 6 фишек Zabbix: применение и настройка

Возможности комбинаторов в ClickHouse

«Чем ближе к вокзалу, тем хуже кебаб?»: «исследование»

Почему observability — это не только Grafana и Prometheus

Как я маркетдату агрегировал. Визуализация данных Nasdaq, LSE и MOEX

С корабля на бал. Межконтинентальный заплыв из Азии в Европу (анализ данных в комплекте)

Вклад авторов