Все потоки

Системный и бизнес-анализ

СтатьиПостыНовостиХабыАвторыКомпании

ptsecurity 23 дек 2025 в 08:35

Киберустойчивость госсектора: ужесточение законов и еще больше ИИ

Простой

9 мин

7.2K

Блог компании Positive TechnologiesИнформационная безопасность * Законодательство в ITИсследования и прогнозы в IT *

Аналитика

На дворе конец 2025 года, и мы продолжаем ~~украшать нашу киберёлку~~ подводить киберитоги и делиться киберпрогнозами. Мы уже вглядывались в кибершторм, оценили ландшафт киберугроз, направленных на Россию в целом. Заглянем в госучреждения и законодательные акты.

Читать далее

+4

Rustam_aka_Rust 23 дек 2025 в 03:47

Чем же типичный заметковед занимается, когда работает со своими записями? Типизация деятельности заметковеда

Средний

11 мин

5.3K

Data Mining * Natural Language Processing *

Мнение

Где-то с месяц я вынашиваю план исследования, с помощью которого хочу оценить эффект практики заметковедения на профессиональную и личную деятельность человека. И каждый раз, как я подходил к этому «снаряду», люди, чье мнение имеет значение, задавали мне вопрос: а что такое заметковедение?

Всякая попытка объяснить разбивалась о стену непонимания. Мои собеседники своими вопросами и комментариями демонстрировали растерянность. В конечном итоге говорили, что им непонятно, и мне приходилось думать дальше. В попытке разобраться, что же такое заметковедение, я изучал свои записи, которых очень много в моей базе, спрашивал участников нашего сообщества, разговаривал с профессионалами из разных областей.

Каждый человек, когда я интересовался у него относительно того, как он ведет свои личные и профессиональные записи, отвечая, описывал технические особенности приложений и сервисов, или начинал душнить[^1], или говорил, что он записывает в приложении и «потом» разбирает, без уточнения, что значит «разбирает» и когда это «потом» наступает.

В общем, мне показалось, что имеется очевидная проблема с операционализацией понятия «заметковедение», как, собственно, и задачеделания, и творчества, и любого иного «сложного слова», требующего интерпретации. Тем не менее я не прекращал поиска определения заметковедению, однако найти формулировку, которая вбирала бы весь спектр заметковедческой деятельности, не получалось.

В какой-то момент мне подсказали, что можно сделать, а именно объяснили, как операционализировать понятие «заметковедение», спросив, что люди делают, когда им приходит идея, попросив описать то, как они «потом» разбирают свои записи, и что происходит при процессе «вдумчивого» обучения.

Читать далее

0

Eco_coder 22 дек 2025 в 18:54

Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»

Простой

4 мин

11K

Python * Научно-популярноеГовнокодЗанимательные задачкиNatural Language Processing *

С помощью предобученной мультиязычной модели LaBSE и методов снижения размерности выяснил, что поэмы Лермонтова и Симонова, несмотря на столетнюю дистанцию, семантически близки. Подтвердил гипотезу, что русская патриотическая поэзия сохраняет устойчивое смысловое ядро, даже когда меняется стиль и идеология.

Читать далее

-6

koptelovak 22 дек 2025 в 11:27

От требований к анализу показателей процесса к построению структуры данных

Простой

5 мин

6.1K

Блог компании OTUSАнализ и проектирование систем *

Кейс

Внедряя системы класса Business Intelligence (BI), приходилось в проектах разрабатывать систему показателей для различных бизнес-процессов. Почему пришлось создать данный подход? Потому что представители заказчика часто не могли сформулировать перечень ожидаемых показателей по процессу, и поэтому пришлось проектировать систему показателей для анализа процесса за них. Подробнее про показатели процессов и основные определения (бизнес-объект, метрика, аналитический разрез и показатель) можно прочитать в моей ленте ранее. В данной статье хочу «спуститься» от системы показателей по процессу к структуре данных на примере процесса подготовки коммерческого предложения.

В качестве примера приведу систему показателей процесса разработки коммерческого предложения для продажи услуг в области обучения на рынке B2B. Сразу хочу сказать, что процесс не оптимален, но для данного примера он необходим для погружения в предметную область.

К модели данных

+8

negrbluad 22 дек 2025 в 10:29

Как я написал скрипт для 24-часового прогноза рынка: корреляции, волатильность и вероятностная модель

Средний

8 мин

6.5K

Алгоритмы * Финансы в ITPython *

Туториал

Финансовые рынки редко движутся изолированно. Криптовалюты реагируют на фондовые индексы, золото реагирует на макроэкономику, а внутри крипторынка движение биткоина задаёт направление для альткоинов.

Гипотеза проекта:

Если агрегировать данные по разным классам активов (крипто, акции, золото), измерить их волатильность, тренд и взаимную корреляцию, можно получить осмысленную вероятностную оценку того, каким будет рынок в ближайшие 24 часа: рост, падение или консолидация.

Читать далее

0

blognaumen 22 дек 2025 в 10:24

Как продакт и аналитик работают в одной задаче: три кейса из практики

Средний

7 мин

6.3K

Блог компании NAUMENУправление продуктом *

Кейс

Привет! Меня зовут Маша, я продакт ITSM 365 в Naumen. Более 8 лет я работаю в ИТ: начинала как бизнес‑аналитик, затем стала продуктовым аналитиком, позже — менеджером продукта. Сейчас занимаюсь Discovery — исследую новые области, где наши решения могут принести бизнесу пользу.

В этой статье делюсь тремя кейсами и практическим опытом взаимодействия аналитика и продакта в одной задаче, почему это иногда превращается в хаос, и как мы перестраивали процессы, чтобы этого избежать.

Читать далее

+1

kmoseenk 22 дек 2025 в 08:34

Более глубокий взгляд на старый UUIDv4 и новый UUIDv7 в PostgreSQL 18

Средний

13 мин

10K

Блог компании OTUSБазы данных * PostgreSQL *

Аналитика

Перевод

UUIDv4 как первичный ключ в PostgreSQL обычно ругают за «случайность» — но за этим словом прячется конкретная физика: сплиты страниц B-дерева, рыхлый листовой уровень, фрагментация и лишний случайный I/O при чтении. В PostgreSQL 18 появился UUIDv7 — и это хороший повод посмотреть на проблему не на уровне вкусов, а на уровне того, как реально устроены индекс и heap: от корреляции и ctid до статистики страниц и плотности листьев.

Читать далее

+21

RationalAnswer 22 дек 2025 в 04:57

Окончательное решение бабкосхем, а также нейросеть-коммунист в тылу WSJ

7 мин

15K

КриптовалютыФинансы в ITИскусственный интеллект

Дайджест

Самые интересные новости финансов и технологий в России и мире за неделю: тульскую бабулю собираются посадить за неудачный ларисодолинг, ЦБ РФ снизил ставку до 16%, ЕС не решился трогать российские активы, iRobo-пылесосы обанкротились, в США дропнули файлы Эпштейна, запрет лотереи гринкарт, китайские миллиардеры суррогатно рожают себе армии детей, а также еще одна сделка OpenAI.

Читать далее

+31

flowerlimor 21 дек 2025 в 18:16

Анализ 400k вакансий hh.ru: как мы строили пайплайн и какие тренды нашли

Средний

7 мин

13K

Python * Базы данных * Анализ и проектирование систем * Big Data * Проектирование API *

Из песочницы

Какие навыки реально нужны в IT? Разбор рынка по данным hh.ru. Мы обработали 393 000 вакансий за 2025 год и делимся результатами: универсальный стек технологий, медианные зарплаты по специальностям и доля удаленки. А еще — техническая реализация нашего open-source проекта для сбора данных.

Читать далее

+8

negrbluad 21 дек 2025 в 16:39

Полностью автоматизируем трейдинг по аукционной теории — от базы до python робота

Средний

6 мин

14K

Python * Алгоритмы * Финансы в IT

Туториал

В классическом алготрейдинге рынок часто моделируется как временной ряд: индикаторы, скользящие средние, осцилляторы. Аукционная теория рассматривает рынок иначе — как процесс распределения объёма по ценовым уровням, где цена ищет баланс между спросом и предложением.

Ключевым элементом такого подхода является Volume Profile, а именно Point of Control (POC) — уровень цены, на котором за выбранный период был проторгован максимальный объём. В терминах аукционной теории POC соответствует зоне максимального согласия участников рынка.

В статье рассматривается создание алгоритмического торгового бота, основанного на реакции цены относительно основных уровней аукционной теории.

Читать далее

+10

Sergey1Lokhanov 21 дек 2025 в 15:06

Стартап у станка: как бюрократия тормозит «высокотех»

Средний

9 мин

10K

РобототехникаРазвитие стартапаПроизводство и разработка электроники * Открытые данные * Химия

Аналитика

В августе 2023 года вступил в силу закон «О развитии технологических компаний в РФ», который ввёл новую категорию — «малая технологическая компания» (МТК). Под неё могут подпасть как заводы, так и ИТ-компании, создающие продукты и технологии, критически важные для обеспечения технологического суверенитета. Уже к концу 2025 года статус МТК получили более 6,4 тысяч организаций.

Наша компания занимается аналитикой для промышленности, и мы формируем большие массивы данных из открытых источников. Нам показалось интересным провести исследование именно на примере заводов, производящих электронику, специальное оборудование, новые материалы, чтобы понять: 1) какие меры поддержки работают на практике; 2) даёт ли статус МТК реальные конкурентные преимущества промышленности.

В каких условиях развивается "высокотех"

+4

Eaglov 20 дек 2025 в 06:16

Почему аналитика не даёт измеримого бизнес-результата?

Простой

3 мин

7.4K

Визуализация данных * IT-компанииУправление продуктом *

Из песочницы

За десять лет практики в аналитике я часто сталкивался с ситуацией, когда аналитическая функция не даёт измеримого бизнес-результата. При этом от неё обычно ждут инсайтов, которые дают иксы прироста — иногда даже сами по себе, без внедрения.

Проблема неприятная и распространённая. Она решается не просто и не быстро, но для построения устойчивого бизнеса в конкурентной среде решить её всё-таки придётся.

Цель этой статьи — показать, в какой плоскости начинается результативность аналитики. Она будет полезна руководителям, которые задаются вопросом из заголовка, и аналитикам, которые много работают, но не видят измеримого эффекта.

В чём, на мой взгляд, лежит корень этой проблемы?

Основной барьер для получения дивидендов от аналитической функции — это не просто культура принятия решений на данных (которую все пытаются описать модным и часто спекулятивным термином data-driven culture). Ключевая проблема — в системе взаимодействия, обратной связи и ответственности за результат, принятой в компании.

Аналитика, как и любая функция в компании, — это инструмент. А любой инструмент даёт результат только при определённых условиях. Чтобы понять, какие условия необходимы именно вам, нужно честно ответить на три вопроса.

Читать далее

+3

ivan-petrov-analyst 20 дек 2025 в 05:15

Trustworthy experimentation для B2C: как перестать угадывать в A/B‑тестах

Простой

4 мин

7K

Python * Статистика в IT

Из песочницы

В продуктовой аналитике легко дойти до того момента, когда экспериментов много, а доверия к результатам все меньше и меньше: тесты закрывают “когда стало понятно”, p-value проверяют чуть ли не каждый день (принимая преждевременные решения), MDE забывают фиксировать, а денежные метрики зашумлены так, что выводы получаются, мягко говоря, спорные.

В этой статье я показываю практический каркас для более надежных A/B-тестов в B2C: как делать анализ мощности и размера выборки для конверсии и ARPU, как интерпретировать кривую мощности анализа теста и trade-off между MDE, длительностью и доступным трафиком, и почему ratio-метрики вроде выручки на сессию часто лучше голого ARPU.

Отдельно разбираю линеаризацию ratio-метрик: как привести их к user-level значениям, чтобы применять стандартные тесты корректнее и стабильнее.

Читать далее

+1

Argxotan 19 дек 2025 в 14:17

Как мы перестроили систему роста для 150 менеджеров аналитики: кейс Авито

Средний

6 мин

12K

Блог компании AvitoTechУправление персоналом * Карьера в IT-индустрии

Обзор

Привет! Я Александр Моисеев, директор по аналитике Авито. Чтобы рост стал более прозрачным и предсказуемым, а оценка перформанса более объективной, мы пересобрали менеджерскую линейку и внедрили числовые грейды для менеджеров аналитики. В статье расскажу, зачем мы это сделали, как устроили новую линейку и что это дало сотрудникам и компании. Читайте мой небольшой обзор новой матрицы и забирайте наши практики себе в компанию — ссылка на матрицу компетенций в конце материала.

Читать далее

+27

Cordekk 19 дек 2025 в 11:38

Эффективное управление рисками и несоответствиями: от формальностей к действиям

Простой

3 мин

5.6K

Анализ и проектирование систем *

Мнение

Recovery Mode

В системах менеджмента качества работа с рисками и несоответствиями часто сводится к механическому заполнению реестров. Сотрудники фиксируют риски, указывают абстрактные «мероприятия по снижению» и откладывают документы в архив. Но управление — это не бумажная работа, а распределение ответственности и контроль результатов. Как перейти от формальностей к реальным действиям?

Проблема традиционного подхода
Типичный реестр рисков содержит столбцы: «Риск», «Оценка», «Мероприятия». Однако в колонке с действиями часто фигурируют расплывчатые формулировки вроде «довести задачи до персонала через обучение». Где конкретика? Кто отвечает? Каков срок? Без ответов на эти вопросы даже самые продуманные меры остаются на бумаге. Такой подход не обеспечивает прозрачности: нет контроля исполнения, оценки эффективности и вовлечения сотрудников.

Решение: Реестр действий вместо абстрактных мероприятий

Читать далее

0

Hell-Writer 19 дек 2025 в 09:19

Почему ночных загрузок стало недостаточно: опыт внедрения CDC в М2

Средний

6 мин

5.5K

Блог компании m2_techData Engineering * Python * SQL * Базы данных *

Кейс

Всем привет, меня зовут Игорь Горбенко, и я системный аналитик в компании М2.
Отчёты, которые обновляются раз в сутки, хорошо подходят для стратегической аналитики. Но в какой-то момент бизнесу становится важно понимать, что происходит в течение дня, а не только по итогам ночной загрузки.

В М2 мы столкнулись с этим, когда от продуктовых команд и службы поддержки начали приходить запросы на внутридневную отчётность и почти real-time метрики. Наш основной подход — ежедневная батчевая загрузка данных — перестал закрывать такие сценарии, и нам понадобился другой способ работы с изменениями в продуктовых базах.

В этой статье я расскажу, как мы внедряли Change Data Capture (CDC) с использованием Apache Flink, какие задачи это помогло решить, с какими ограничениями мы столкнулись и почему CDC — полезный, но не универсальный инструмент.

CDC и Apache Flink: кратко о технологии и нашем подходе

Давайте начнем разбираться. Некоторые из вас наверняка знакомы с понятием CDC, Change Data Capture — техника захвата изменений в базах данных.

Для контекста стоит отметить Apache Flink — движок для загрузки и обработки батчей и стриминговых данных в реальном времени. В статье речь пойдет про Flink CDC — фреймворк с открытым исходным кодом для отслеживания изменений данных в базах данных в реальном времени.

В проектах нашего отдела в М2 основной метод загрузки — это ежедневное ночное
копирование продуктовых баз данных (PostgreSQL, MongoDB) в аналитическое хранилище на базе Apache Iceberg и последующая их обработка с помощью движка Trino.

Читать далее

+8

EvgenyVilkov 19 дек 2025 в 08:57

Проверяем популярные движки вычислений на задаче BI-доступа с помощью теста ClickBench

Средний

6 мин

5.4K

Блог компании Data SapienceData Engineering * Big Data * Высоконагруженные системы * Базы данных *

В сегодняшней публикации мы попробуем разобраться в производительности популярных MPP-движков в специализированной задаче ХД – предоставлении доступа к денормализованной витрине данных. Также ответим на вопрос: нужен ли ClickHouse в аналитическом ландшафте, спроектированном по принципу Lakehouse-платформ? Для этого будем использовать бенчмарк ClickBench.

ClickBench появился не так давно, в 2022 году. Методика создана и поддерживается командой ClickHouse. Авторы позиционируют его следующим образом - «Этот бенчмарк представляет типичную рабочую нагрузку в следующих областях: анализ потоков кликов и трафика, веб-аналитика, машинно-генерируемые данные, структурированные журналы и данные о событиях. Он охватывает типичные запросы в ad-hoc аналитике и дашбордах реального времени». Последний сценарий вызывает у нас особый интерес, ведь редко встретишь архитектурный дизайн аналитического ландшафта, где не было бы решения на базе ClickHouse именно для этой цели, на вершине пирамиды тракта данных от источника до потребителя.

Читать далее

+6

parusimore 19 дек 2025 в 08:51

Учебник для искусственного разума: как я сделал ИИ-помощника по планированию для 1С:ERP

Простой

9 мин

7.3K

Интерфейсы * Исследования и прогнозы в IT * Искусственный интеллектERP-системы * 1С *

Кейс

Сезон ИИ в разработке

В этой статье:

Технология создания ИИ-помощника для работы с 1С:ERP.

Почему невозможно создать такого помощника, опираясь только на официальную документацию 1С.

И почему та же самая документация 1С, при правильной обработке, способна превратить ИИ в супер-помощника – то есть многократно его усилить.

Читать далее

+2

rinat_val 19 дек 2025 в 08:46

Из опыта команды VK Видео: как мы оцениваем эффект от видеоконтента и при чём здесь propensity score

Средний

13 мин

7.8K

Блог компании VKУправление продуктом * Анализ и проектирование систем * Статистика в IT

Туториал

Привет, Хабр! Меня зовут Ринат Валеев, я старший аналитик в R&D-команде VK Видео.

Команде любого видеосервиса важно оценивать, какой эффект видеоконтент оказывает на аудиторию. Это нужно, чтобы оптимизировать продукты, повышать вовлечённость пользователей, увеличивать конверсию и экономить ресурсы на производстве материалов. В рамках стратегии непрерывного развития сервиса такие задачи решаем и мы в VK Видео.

В этой статье покажу, как мы адаптировали метод propensity score под задачи видеосервиса, автоматизировали расчёты и собрали на их основе удобный self-service инструмент.

Читать далее

+31

KDim4eg91 18 дек 2025 в 11:56

SQL-собеседование без паники: что реально спрашивают и где валятся даже сильные

Простой

5 мин

16K

SQL * Data Engineering *

Роадмэп

Recovery Mode

На SQL-собеседованиях интервьюер часто формулирует условия устно, просит рассуждать вслух и быстро писать запрос в реальном времени. Это непривычный формат — и именно поэтому он становится испытанием даже для тех, кто много практиковался.

Читать далее

+7

1 2 ...

33

34 35 ...