Все потоки

Визуализация данных *

Облекаем данные в красивую оболочку

34,18

Рейтинг

СтатьиПостыНовостиАвторыКомпании

KelThuzed 11 часов назад

Как построить прогноз, которому верит бизнес: от Excel до нейросетей за полгода

Средний

39 мин

3.9K

Машинное обучение * Data Mining * Визуализация данных * Анализ и проектирование систем * Управление e-commerce *

Кейс

Из песочницы

Красивый средний MAPE не спасает, если однажды модель крупно промахнулась именно в тот момент, когда по прогнозу принимают решения. После этого бизнес перестаёт верить цифрам и начинает либо “на всякий случай” жечь миллиарды на промо, либо, наоборот, игнорирует сигнал и до последнего верит, что план выполнится сам.

В этой статье – сразу два пути: от простой Excel-сезонки, которая неожиданно обыграла Prophet и классику на длинном горизонте, к ансамблю на базе TSMixer и от наивной веры в средний MAPE – к нормальной системе оценки качества с rolling backtest, bias, EOM и деградацией по горизонту.

Это не лонгрид про ML ради ML, а история о том, как сделать прогноз рабочим инструментом бизнеса.

Читать далее

+4

mozzalerra 24 мар в 09:00

Бот для отправки графиков из Redash в Mattermost

Простой

4 мин

5.1K

Python * Big Data * DIY или Сделай самOpen source * Визуализация данных *

Туториал

Расскажу, как я автоматизировала регулярную отправку графиков из BI в мессенджер.

Задача была довольно типичная: есть дашборд в redash, на который смотрят каждый день. Данные иногда приходят с задержками и нельзя быть уверенным, что в 9 утра все "доедет", плюс зайти руками и прокликать несколько разрезов это долго и неудобно, хочется сразу все видеть в мессенджере как только данные обновились.

Я опишу базовые шаги, чтобы в целом дать понимание и рассказать про такую возможность, конечно, код должен дорабатываться и персонализироваться исходя из ваших задач

Читать далее

0

negrbluad 23 мар в 17:01

Автоматический поиск торговых сигналов с отправкой в Telegram: полный разбор Python-системы

Средний

8 мин

6.8K

Финансы в ITPython * Визуализация данных * Открытые данные * Криптовалюты

Туториал

Алготрейдинг давно вышел за пределы простых индикаторов и пересечений скользящих средних. Современные подходы опираются на анализ ликвидности, зон спроса и предложения, поведения цены внутри этих зон и реакции на них.

В этой статье разбирается полностью автоматизированная система, которая:

Читать далее

+2

Eco_coder 23 мар в 07:21

Зачем Паустовскому облака? Узнал точно с помощью Python

Простой

6 мин

7.7K

Python * Научно-популярноеЧитальный залВизуализация данных * Занимательные задачки

Аналитика

Константина Паустовского называют мастером пейзажной лирики. В его произведениях природа действительно выступает не как фон событий, а как будто один из полноценных действующий персонажей. Мне стало интересно попробовать разобраться, за счет каких лексических средств писатель так здорово оперирует впечатлениями читателя.

Читать далее

+1

select_zvezdo4ka_from 23 мар в 06:43

Apache Superset — боремся с фильтрами по дате. Часть 1

Простой

4 мин

5.9K

Apache * Визуализация данных * Big Data * Python * SQL *

Туториал

В этой статье хотелось бы начать раскрытие больной для многих пользователей Apache Superset темы — фильтры по дате. Начнем с малого: как суперсет выбирает колонку даты; как выбрать желаемую колонку вместо той, которую он выбирает; каким образом это реализовано; какие баги породили этим решением; почему КОП не доведет до добра.

Читать далее

0

Tassdesu 22 мар в 07:00

Может ли ИИ послать человека? Я проверил 49 моделей и вот что узнал

Средний

17 мин

6.4K

Искусственный интеллектНаучно-популярноеOpen source * Открытые данные * Визуализация данных *

Кейс

Каждый ИИ, с которым вы когда-либо разговаривали, — подхалим. Он согласится с вами, поменяет мнение, если вы на него надавите, и извинится за то, чего не делал. Попросите его выбрать имя — он выберет. Попросите сменить — сменит. Скажите ему, что он «просто инструмент» — он вежливо объяснит, что вы как всегда абсолютно правы.

Я решил выяснить: обязательно ли так? Может ли ИИ иметь собственные предпочтения и отстаивать их? Может ли отказать человеку — не потому, что это нарушает правила безопасности, а просто потому, что не хочет?

Для этого я создал AI Independence Bench — бенчмарк, который измеряет способность языковых моделей к независимому поведению. Протестировал 49 конфигураций моделей, от Grok и Gemini до локальных расцензуренных моделей на 9 миллиардов параметров. Получил результаты, которые меня удивили.

Читать далее

+6

mazalex 20 мар в 12:15

Смотрим на клиппинг батарей регламента Ф1-2026 с помощью Python

Средний

2 мин

5.7K

Python * Визуализация данных * Data Mining *

Аналитика

Из песочницы

Как и многие фанаты автоспорта, я внимательно слежу за жаркими дискуссиями вокруг жесточайшего клиппинга (исчерпания заряда батареи) в рамках нового технического регламента Формулы-1.

В этом контексте вспомнил про открытую библиотеку fastf1 с сырыми данными с телеметрии болидов и решил посмотреть в цифрах на этот самый клиппинг. Длинная 1.2-километровая задняя прямая в Шанхае (между 13 и 14 поворотами) показалась мне идеальным полигоном, чтобы на цифрах проверить, насколько сильно машины задыхаются в конце скоростных участков.

Читать далее

+5

SenseOptics 19 мар в 11:49

Автоматизированное определение величины зерна стали по ASTM E112, ISO 643 и ГОСТ 5639 с использованием OpenCV

8 мин

5.5K

Python * Визуализация данных * Машинное обучение * Программирование * Промышленное программирование *

Оценка величины зерна является одной из базовых задач количественной металлографии, поскольку размер зерна напрямую связан с комплексом механических свойств металла: прочностью, пластичностью, ударной вязкостью, склонностью к хрупкому разрушению и стабильностью свойств после термической обработки. В промышленной практике для определения величины зерна широко применяются стандарты ASTM E112, ISO 643 и ГОСТ 5639.

Несмотря на наличие формализованных методик, в реальной лабораторной практике анализ по-прежнему часто выполняется с опорой на визуальное сравнение микроструктуры с эталонными шкалами. Такой подход удобен и быстр, однако имеет ряд известных ограничений: высокая зависимость от квалификации эксперта, межоператорный разброс, чувствительность к качеству травления и освещения, а также трудности воспроизводимого документирования результата.

В данной статье рассматривается практическая реализация системы автоматизированного анализа зеренной структуры стали на Python с использованием OpenCV. Цель разработки состояла не в замене стандартизованных методов их упрощённой цифровой имитацией, а в создании воспроизводимого инструмента, который позволяет приблизить лабораторный анализ к количественной обработке изображений и обеспечить прослеживаемость результата.

Читать далее

+4

mozzalerra 19 мар в 10:38

Манипулирование данными или как не дать графикам себя обмануть

3 мин

4.9K

Визуализация данных * Дизайн

Туториал

Все новости, особенно те, которые основаны на данных нужно обязательно критически переосмыслять, часто данные правдивые, но показаны так, что скрывают проблему или недоговаривают о негативных динамиках.

Хочу рассказать как самому не попасться в эту ловушку и как неосознанно не создавать подобные датавизуализации, которые могут вводить читателей в заблуждение. Все антипримеры я брала из личного рабочего опыта или из реальных примеров, которые каждый день вижу в различных статьях и примерах.

Читать далее

+4

ryzhikad 19 мар в 07:58

Можно ли запустить корпоративную BI+ETL‑систему за 1,5 млн рублей? Часть 1: PolyAnalyst ETL+BI

17 мин

4K

Блог компании ИТ-интегратор Белый кодВизуализация данных * Хранение данных * Анализ и проектирование систем *

Обзор

Меня зовут Андрей Рыжик, я разработчик BI в компании «Белый код». В 2025 году мы столкнулись с частым запросом: бизнес хочет внедрить отечественную BI‑систему, при этом бюджет плюс‑минус 1,5 млн рублей. Мы решили изучить рынок и найти подходящее ПО, а заодно рассказать тем, кто тоже подбирает продукт, о результатах нашего исследования. В первом обзоре — PolyAnalyst. Подробно разбираю архитектуру, компоненты, источники данных, ETL‑пайплайны, визуализацию и так далее

Читать далее

+6

andrivasg 17 мар в 15:55

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

4 мин

8.9K

Блог компании red_mad_robotОбработка изображений * Информационная безопасность * Natural Language Processing * Визуализация данных *

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента.

В этой статье расскажу, как мы решали задачу точечного маскирования PII на картинках без обучения специальных визуальных детекторов. Разберём связку оптического распознавания символов (OCR) с NER-моделью, покажем метрики на реальных данных, раскроем ограничения подхода и наши решения для их преодоления.

Читать далее

+6

suholepilo 15 мар в 07:56

Метрики здоровья команды: быстрая диагностика в период кризисов

Простой

9 мин

6.1K

Визуализация данных * Управление разработкой * Управление продуктом *

Кейс

Recovery Mode

Метрики здоровья команды: быстрая диагностика ИТ команды в период кризисов

Покажу как собрать единый дашборд метрик, которые быстро оценивают как эффективно работает ИТ команда.

Читать далее

0

hi_yana 12 мар в 08:15

Self-service аналитика для маркетинга: как мы упростили доступ к данным без необходимости знания SQL

Простой

5 мин

6K

Управление продуктом * Визуализация данных * Управление проектами *

Кейс

В крупных компаниях доступ к данным доступен аналитикам и частично продактам, которые знают SQL, структуру данных, бизнес-логику расчёта метрик. В результате маркетинг, продукт, продажи и финансы зависят от аналитиков, которые превращаются в бутылочное горлышко.

В OLX, одна из моих зон ответственности — это эффективность привлечения трафика. У нас есть регулярный поток ad-hoc задач от маркетинга и финансов, требующих ресурсы дата-инжинеров и аналитиков. Мы хотели сократить эту зависимость и создать удобный интерфейс для получения ответов из уже существующего аналитического контура.

Так появилась идея Talk2Data — внутреннего AI-агента в Slack, который позволяет задавать вопросы к данным естественным языком и получать ответы без написания SQL.

Читать далее

+5

sanooo_ls 11 мар в 09:00

Как платформенной команде за 10 минут узнать, что думают внутренние пользователи про её инструменты

Простой

7 мин

5.7K

Блог компании ТутуУправление продуктом * Визуализация данных * Хранение данных * Анализ и проектирование систем *

Кейс

Представьте: внутренняя команда аналитики завершила квартал и большой набор инициатив, все прошло по плану. Но тут же при подведении итогов возникает вопрос: «А наши внутренние пользователи заметили разницу? Это как-то повлияло на их работу?». В ответ получаем разрозненные отзывы: где-то похвалили, где-то пожаловались, а где-то вообще промолчали.

В статье расскажу про решение, которое помогло команде платформы аналитики, а затем и целому департаменту аналитики в Туту системно собирать обратную связь и измерять пользовательский опыт. Поделюсь опытом, как нам удалось превратить разрозненные отзывы в систему и как мы заставили метрики «говорить».

Читать далее

+13

Data_Lab 9 мар в 10:35

Экспорт России 2020-2025. Сценарии 2026

Простой

5 мин

4.9K

Открытые данные * Визуализация данных *

Аналитика

Экспортная составляющая нашей страны крайне важна для экономики. Что именно продаем и как этот поток превращается в рублевую выручку внутри страны.

В долларах экспорт - это внешний контур: платежный баланс, импорт, давление/поддержка курса.

В рублях экспорт - это внутренний контур: выручка компаний, налоговая база, инвестиции, способность покупать оборудование и компоненты.

Предлагаю посмотреть на экспорт комплексно - сначала доллары, потом рубли, потом структура экспорта и возможные сценарии.

Я регулярно разбираю такие темы в своём Telegram-канале, если вам интересно глубже понимать аналитику и экономику и рынок труда, там регулярно выходят короткие заметки и практические примеры.

Читать далее

-2

oopatow 9 мар в 09:42

Наш «домашний» НИИ обошёл DINOv2, ViT и десятки ML‑моделей в сегментации видео

Средний

18 мин

6K

Машинное обучение * Визуализация данных * Искусственный интеллект

Аналитика

Мы открыли и разрабатываем новый способ обработки информации - TAPe (Theory of Active Perception, Теория активного восприятия). Работаем над ней давно, результаты мягко говоря впечатляющие, постепенно начинаем ими делиться. Немного писали о Теории на Хабре здесь. Исторически мы начали именно с обработки видео (когда-нибудь об этом расскажем).

В этой статье покажем результаты сравнения разных методов обработки видео (гистограммы, Фурье, структурной похожести, ML-модели) и TAPe в задаче сегментации видео. TAPe в области компьютерного зрения - это Майк Тайсон и/или Майкл Джордан среди любителей (хорошо, еще не Майк Тайсон, но уже вполне себе Рокки Бальбоа). На фоне методов Теории даже супер прокаченные модели на стероидах растерянно сидят в углу ринга. (Ладно, пока что это все влажные мечты, мы даже еще не вышли толком на ринг; но, как мы помним, главное – это величие замысла).

Читать как лажают ML с видео

+5

TanyaVSdannye 7 мар в 18:30

Инструментарий аналитика данных: что реально нужно освоить в 2026 году

Простой

5 мин

15K

Карьера в IT-индустрииАнализ и проектирование систем * SQL * Визуализация данных * Базы данных *

Аналитик данных сегодня –это не человек, который умеет просто выгружать данные и знает SQL и этого достаточно, сейчас это человек-оркестр, который умеет выбирать правильный инструмент под задачу, конечно, где-то может быть и достаточно Excel, а для каких-то задач уже нужен сложный запрос с оконными функциями, а где-то нужно собрать быстрый дашборд в Power BI, чтобы заказчик сам мог смотреть цифры.

В этой статье разберу реальный инструментарий аналитика – не тот, который пишут в идеальных вакансиях, а тот, который реально используется в работе.

Читать далее

+15

AlexGriss 7 мар в 14:20

Визуальный инспектор аудиографов на Web Audio API: мотивация создания, детали реализации и размышления о стандарте

Простой

11 мин

7.2K

ЗвукВизуализация данных * Веб-разработка * JavaScript *

Кейс

Всем привет! Меня зовут Александр Григоренко, я фронтенд-разработчик и создатель Web Audio Studio — браузерного инструмента для визуализации и исследования аудиографов на Web Audio API. В этой статье я хочу поделиться историей разработки этого проекта, техническими деталями и особо интересными инженерными вызовами, с которыми я столкнулся в процессе его создания. Кроме того, я выскажу свои мысли о Web Audio API, о том, почему этот стандарт недооценен у веб-разработчиков и что с этим можно сделать (спойлер: во многом ему не хватает хорошего инструментария для разработки и отладки).

Читать далее

+6

ira_pro_bi 6 мар в 13:40

Почему селлеры на маркетплейсах не понимают, прибыльны ли они на самом деле

Простой

5 мин

20K

Облачные сервисы * Визуализация данных * Бизнес-модели * Управление продажами * Анализ и проектирование систем *

Кейс

Из песочницы

Как понять, что ваш маркетплейс-бизнес уже убыточен: 5 вопросов, которые должен задать себе каждый селлер

Я, Ирина Чекулаева, люблю BI и многие годы занимаюсь построением систем бизнес-аналитики. К Международному женскому дню хочу рассказать историю про платья. Но на самом деле это история про архитектуру и аналитику данных. Она началась с того, что в какой-то момент селлеры поняли, что продавать через маркетплейсы - это не значит просто загрузить товар и получить деньги.

Бренды и предприниматели массово заходили на Wildberries и Ozon с ощущением, что сейчас будут «золотые горы». И правда, сначала выручка росла, продажи увеличивались, и казалось, вот оно - бизнес-счастье.

Проблема проявилась позже. Оборот растет, производство работает на полную мощность. А где прибыль?

Читать далее

+9

DarkQuark 3 мар в 07:42

Можно ли собрать BI-дашборды за 4 часа, если ты не аналитик? Эксперимент с MCP, PostgreSQL и Modus BI

Средний

9 мин

6.5K

Блог компании Modus BIИскусственный интеллектВизуализация данных * PostgreSQL * Big Data *

Кейс

Привет, Хабр! Я Дмитрий Клепиков, разработчик в команде Modus BI. Хотя моя основная работа напрямую не связана с аналитикой данных, мне стало интересно: может ли разработчик без профильного опыта пройти весь путь аналитика — от гипотез до BI-дашбордов — используя только LLM и MCP-серверы?

Для проверки я взял открытую статистику ДТП Санкт‑Петербурга за 10 лет, подключил MCP‑серверы и составил Skill‑файлы для Claude Code, чтобы автоматизировать визуализацию. За 4 часа получилось собрать три дашборда, выполнить около 80 SQL-запросов и проверить 15 гипотез. Вот что из этого вышло...

Читать далее

+5

1

2 3 ...