Обновить
104.13

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Мониторинг рынка аренды Санкт-Петербург

Уровень сложностиПростой
Время на прочтение1 мин
Охват и читатели5.1K

Решил немного изучить рынок аренды жилья в городе Санкт-Петербург.
Что сейчас по ценам, где и какие квартиры дешевле или дороже?

Данные: ЦИАН, 7 038 объявлений (цены предложения, не сделки). База - медиана, чтобы не искажаться хвостом.

В итоге собрал вот такой PDF-отчет за январь 2026 (яндекс диск).

Читать далее

Новости

Реализация MCP в Open WebUI. Часть 1. Интеграция c Open WebUI

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели4.7K

В момент выхода протокола MCP нас очень заинтересовали его возможности. Нам хотелось использовать этот протокол для того, чтобы внутренние пользователи могли обращаться к базе данных в свободной форме и получать данные в течение нескольких минут. MCP для этого выглядел очень хорошо: пользователь может сформировать запрос на удобном для него языке, а LLM поймет, что нужно сделать и сделает это.
На первый взгляд MCP в связке с LLM полностью закрывал данные проблемы, однако с ростом объема данных стало заметно, что LLM не удается обрабатывать их быстро и качественно, а написание SQL запросов для нее не всегда легкая задача (даже если примеры этих запросов у нее есть в промпте). В итоге мы получили потерю контроля над контекстом модели и непредсказуемый результат.
В этой части я расскажу про интеграцию с Open WebUI и какая архитектура модели позволила победить вышеуказанные проблемы. Следующие статьи расскажут о реализации MCP таким, каким он позволяет выполнять наши задачи (но не финальной версии). Эта статья может быть полезна всем, кто строит свои модели на основе Open WebUI или еще только выбирает фреймворк, на котором предстоит строить будущую модель

К интеграции с Open WebUI

MDM: как навести порядок в НСИ и перестать чинить интеграции

Уровень сложностиСредний
Время на прочтение36 мин
Охват и читатели7.2K

В любой компании справочники НСИ сначала выглядят как “ну это же просто таблицы”. Контрагенты, номенклатура, адреса, подразделения, единицы измерения, статусы. Пока людей и систем мало - всё держится на внимательности пары сотрудников и привычке “если что, поправим руками”.

Читать далее

Как мы случайно сделали Semantic Wiki в Gramax

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.3K

Всем привет! Меня зовут Катя, я развиваю Gramax — базу знаний для it-команд. В этой статье я расскажу, как мы решали довольно очевидную проблему связи знаний и случайно сделали штуку, у которой даже есть отдельное название.

Когда говорят «Semantic Wiki», обычно представляют что-то сложное: онтологии, RDF, графы и так далее. Но можно ли это сделать как-то проще и для людей? В этой статье разберем:

Что делает вики «семантической».

Как свойства и представления в Gramax решают эти задачи.

Как быстро создать семантическую структуру, связать с ее помощью статьи и посмотреть по ним отчеты.

Эта статья для тех, кого волнуют вопросы: качественного ведения базы знаний, создания единого источника правды, построения полезных связей между знаниями (а не банальной линковки, которая побьется через пару релизов).

Поехали!

«Атлас Telegram» — как создавалась интерактивная карта с 500 000 каналами

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели12K

Мы привыкли видеть Telegram как список чатов и каналов на своём устройстве. Но это лишь малая часть большой экосистемы, ограниченная подписками каждого пользователя. А как выглядит вся экосистема целиком? Эта статья — о том, как мы провели масштабное исследование контента Telegram и разработали интерактивную карту с 500 000 каналами.

Читать далее

Визуализация данных в Python с помощью библиотеки Plotly: база для новичков

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели9.4K

Plotly — библиотека для интерактивной визуализации данных в Python. Она подходит для задач, где статичного графика недостаточно и важно исследовать данные прямо в процессе анализа.

В статье разбираем базовые возможности Plotly и основные типы графиков.

Читать далее

5 способов соврать с помощью графика: как нас обманывают цифры

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

Говорят, что цифры не лгут, но графики — совсем другое дело. Мы привыкли доверять красивым дашбордам, но наш мозг считывает картинку быстрее, чем успевает включиться логика. Этим охотно пользуются маркетологи, политики и стартаперы. В этой статье разберем 5 классических приемов визуального обмана: от «откушенных» осей до коварных 3D-пирогов, которые превращают стагнацию в триумф прямо у вас на глазах.

Читать далее

Правила выживания дизайнера на заводе: от Figma к ГОСТам

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели14K

Пока вы спорите о скруглении углов в новой дизайн-системе и попиваете лавандовый раф, где-то в Челябинске ослепленный бликами от раскаленной стали оператор пытается разглядеть ваш элегантный серый шрифт на мониторе 2012 года выпуска. Спойлер: у него не получается.

Дизайнеры, приходящие из разных сфер в Heavy Digital, совершают одни и те же ошибки. Они становятся очевидными только тогда, когда ты снимаешь белые кроссовки, надеваешь каску, проходишь инструктаж по технике безопасности и заходишь в реальный цех.

С 2020 года я набила достаточно шишек, пытаясь подружить стерильную эстетику Figma с суровой реальностью ГОСТов и промышленных мониторов. 

Добро пожаловать в цех! Разберем по полочкам, как не провалить проект на этапе компонентов.

Читать далее

Как я делала pet-дашборд для портфолио: кейс аналитики путешествий

Время на прочтение5 мин
Охват и читатели6.9K

Pet-проекты — один из самых удобных форматов для демонстрации подхода к аналитике и работе с данными, особенно когда рабочие кейсы нельзя показывать из-за NDA. В этой статье я разбираю pet-проект аналитического дашборда для выбора курорта и отеля: как подбирала данные, формировала аналитические сценарии и проектировала интерфейс, ориентированный на принятие решений, а не на демонстрацию метрик.

Читать далее

Наглядная математика с Python и Minecraft

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели9.3K

Введение

Для большого числа людей математика – это сложная наука. Многие из них имеют представление, что математика сводится к арифметике, планиметрии, стереометрии и алгебры. Возможно, кто-то вспомнит что есть и математический анализ.

Такие разделы как аналитическая и дифференциальная геометрия, теория чисел, математическая логика, линейная алгебра и т.д., известны малому кругу людей.

Статистика выбора технических направлений

Согласно статистическим данным выбора детьми кружков для дополнительного занятия, мы видим, что стабильно из года в года всего 5 - 9 % процентов детей от общего числа, «выбирают» так называемые «научно-технические» кружки. К ним относят математические и физические кружки, робототехнику, программирование, радиотехнику, биологические и медицинские кружки. Но даже выбрав направление нет гарантий, что ребёнок закончит предназначенный для него курс. Почти 60% детей, которые пришли на кружки покидают их, не справившись со сложностью подаваемого материала.

         Согласно социологическим опросам (2023 - 2025 годов) видно, что преобладают люди от 35 лет и старше, которые переучиваются или хотят пойти учиться по техническим направлениям, чтобы сменить профессию. Получается, что только с возрастом человек осознаёт значимость «научно-технических» направлений. Но обучать взрослого человека не тоже самое, что обучать ребёнка 9-12 лет.

Причины низкой популярности

         У каждого поколения должен быть свой подход в обучении. Почему же так непопулярно «научно-техническое» направление среди детей?

Читать далее

Идентификация звёзд и при чём тут сингулярное разложение

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.2K

Рассказ о том, как с помощью одной матрицы и двух чисел научиться распознавать любые созвездия на небе.

Читать далее

Наглядная аналитика: разбираем кейсы по работе с данными через OLAP-кубы

Время на прочтение8 мин
Охват и читатели5.8K

Всем, кто работает с данными, знакома ситуация: цифр много, а понятных инсайтов — мало. Рутинные отчеты в Excel съедают время, а ответ на внезапный вопрос от руководства превращается в многочасовой квест.

Всем привет, меня зовут Ирина Севрюкова, руководитель отдела бизнес-анализа Polymatica. В этой статье я на реальных задачах разберу, как современные OLAP‑системы (на примере платформы Polymatica BI) позволяют не просто строить отчеты из больших данных, а проводить живой анализ данных, находить скрытые зависимости и быстро проверять гипотезы.

Несмотря на на то, что статья описывает проблемы заказчика в АПК, аналогичные задачи встречаются во многих отраслях.

Читать далее

Метрики тщеславия (Vanity Metrics): как красивые цифры мешают принимать правильные решения

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели4.2K

Поговорим в этой статье о метриках тщеславия — показателях, которые красиво выглядят в отчётах, но плохо помогают принимать решения. В тексте разбирается, почему такие метрики вводят в заблуждение, как отличить их от действительно полезных показателей и на какие альтернативы стоит опираться, чтобы объективно оценивать рост и здоровье продукта или бизнеса.

Читать далее

Ближайшие события

Линейная регрессия, встряска рейтинга и первое место. Часть 1: Ёлочка, живи

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели8.2K

Сказ о том, как после долгого перерыва я "взял в руки шашки" (поучаствовал в ML-соревновании) и дотащил задачу на "таблички" до первого места на финальном "приватном" лидерборде с помощью простейшей подготовки фич и классической линейной регрессии с регуляризацией, внезапно обогнав при этом всех модных катбустеров, банально переобучившихся на "паблике".

В задаче нужно было предсказать, "доживёт" ли ёлка до определённой даты, учитывая время рубки, наличие дома кота, вес гирлянды, далеко ли от ёлки стоит обогреватель (и есть ли он вообще) и прочие важные и не очень сведения.

Узнать, что влияет на "выживаемость" ёлки

Полное руководство по созданию SMT-индикатора на Pine Script: Теория и практика

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели4.8K

Smart Money Tool (SMT) — концепция из арсенала продвинутых трейдеров, основанная на анализе "умных денег" (крупных игроков). Основная идея: когда рынок делает ложный пробой уровня (свип) на одном инструменте, но не подтверждает его на коррелированном инструменте — это может сигнализировать о манипуляции и потенциальном развороте.

Концепция свипа (Sweep):

Цена временно пробивает значимый уровень (свинг), но закрывается обратно за этим уровнем. Это часто интерпретируется как сбор стоп-лоссов.

Корреляционный анализ:

SMT использует два коррелированных актива (например, BTC и ETH). Расхождение в их поведении может указывать на слабость движения

Break of Structure (слом структуры): Показывает, что движение имеет силу. Дальнейшее подтверждение — закрытие за пределы предыдущего свинга

Чаще всего приходилось искать SMT вручную, что довольно накладно по времени и нередко можно упустить smt банально из-за человеческого фактора. Поэтому для упрощения этой работы я написал pine script индикатор. Выглядеть на графике он будет следующим образом:

Читать далее

Power BI в январе 2026: новые возможности, Copilot, визуализации и изменения для разработчиков

Время на прочтение13 мин
Охват и читатели5.7K

В этой статье — важные изменения для аналитиков, разработчиков и лидов разработки: новые возможности отчётности, обновления моделирования, улучшения для разработчиков и API, развитие Copilot и ИИ, а также объявления о прекращении поддержки отдельных функций. Power BI продолжает двигаться в сторону более умной, гибкой и масштабируемой аналитики — разбираемся, что именно изменилось и почему это важно.

Читать далее

Как мы мигрировали с Zeppelin и что из этого вышло. Часть 2. Формы

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели4.4K

Это вторая (и заключительная) часть цикла статей о нашей миграции с Zeppelin. О причинах и первом опыте перехода с Zeppelin я рассказал здесь. В данной статье я хочу большее внимание уделить второму виду Zeppelin notebook, которые срочно нуждались в переносе.
Конечно, отчеты для клиентов не были настолько "забагованы" как рассылки: большая часть проблем с Zeppelin крылась именно в cron-е, который временами работал как хотел (или в интерпретаторах, мы так и не смогли разобраться, но ошибка интерпретатора возникала только когда запускали через cron). В отчетах этого звена не было, поэтому их перенос был плавным и основан скорее на особенностях UI/UX дизайна.
Данная статья может быть полезна аналитикам, которые не знают, какой инструмент использовать для своих задач и думают, что писать графический интерфейс крайне сложно (спойлер, нет), а также для команд, которые устали от Zeppelin как UI-инструмента (и от Zeppelin в целом)

Как аналитики пишут UI?

Пишем простейший pine script индикатор для торговли — идеальный вспомогательный инструмент трейдера

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.3K

Я давно торгую на рынках криптовалют, металлов, форексе. И большинство трейдеров знает, что на финансовых рынках значительная часть инструментов движется не изолированно, а в составе коррелирующих групп. Валютные пары, индексы, криптоактивы и производные индексы часто демонстрируют согласованное поведение, поскольку отражают одну и ту же макроэкономическую или риск среду.

Среды таких активов я выделяю особые 'триады активов' - активы с максимальной корреляцией, где расхождение является прямым сигналом. Эти триады - почти общепризнанные тройки. Именно по этим триадам мы будем искать интересное расхождение - PSP. Оно является отличным подтверждением в торговле.

Для упрощения его поиска и работы с ним напишем Pine Script индикатор. Я разберу для вас логику работы psp, логику его использования в торговле, объясню полностью код индикатора и структуру pine script.

Читать далее

Как мы нашли утекающую маржу в сети кофеен на 240 000 чеков/мес: путь от Excel к ежедневной управляемости

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

В сети 26 кофеен на 240k чеков в месяц всё выглядело достаточно хорошо (поток гостей, выручка растёт, но прибыль не соответствует ожиданиям). Рассказываю, как мы собрали ежедневную BI аналитику для управления сетью: от R-Keeper и ETL до витрин в ClickHouse и дашбордов в Yandex DataLens. По дороге упёрлись в типичную проблему: справочники, из-за которых отчёты неточны.

Читать далее

Детская дата-книжка «Кристина в стране диаграмм»

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.9K

Всем, у кого есть любимая интересная работа, наверное хотелось рассказать о ней своим детям, увлечь их, показать, как это здорово и полезно! И пусть они не пойдут по нашим стопам, но хотя бы будут уважать и ценить то, чем увлечены родители. 

Может быть это мечты, иногда хочется попробовать рассказать в красочной и интересной форме о нашей работе своим детям.

Читать далее
1
23 ...