Обновить

Системный и бизнес-анализ

Сначала показывать
Порог рейтинга
Уровень сложности

Линейная и полиномиальная регрессия на C++

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

В статье я (немного фривольно) решил исследовать связь количества прочитанных книг и средней зарплаты программиста. Проанализируем эту связь, построив уравнение линейной регрессии и полиномиальной регрессии (2-й степени)

Читать далее

OI‑сигналы и автоматический трейдинг: пишем трейдинг телеграм бота

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели9.9K

Цель этой статьи — максимально подробно и практично разобрать реальный Python‑проект автоматического трейдинга. Это рабочий бот, который непрерывно анализирует рынок Binance Futures, ищет сигналы по открытому интересу (Open Interest), применяет набор защитных фильтров, работает с множеством пользователей одновременно, управляется через Telegram‑интерфейс, и при необходимости открывает реальные сделки через API биржи BingX.

Я последовательно разберу всю логику и все функции основного файла main.py, объясняя, как и зачем они реализованы именно так.

Читать далее

Параметры Python, которые должен знать питонист

Уровень сложностиПростой
Время на прочтение18 мин
Охват и читатели21K

Есть числа, которые полезно знать программистам на Python. Насколько быстро добавляется элемент в список? Как насчет открытия файла? Это занимает меньше миллисекунды? Если ваш алгоритм зависит от производительности, какую структуру данных вы должны использовать? Сколько памяти занимает число с плавающей запятой, один символ или пустая строка? Насколько быстр FastAPI по сравнению с Django?

Это перевод недавней работы Michael Kennedy с подробными пояснениями для начинающих питонистов, которых нет у автора.

Читать далее

Что с рынком труда? Трейсеры индекса headhunter и безработицы

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.5K

Наблюдая сейчас за рынком труда в России, у меня создается ощущение, что на рынке труда то людей не хватает, то внезапно вакансий становится меньше, то зарплаты начинают вести себя как-то странно.

Прикол в том, что рынок труда почти никогда не меняется в один какой-то месяц, он скорее меняет фазы. И если научиться видеть фазу, то дальше в голове появляется некая карта: где мы сейчас, что будет дальше по инерции, и какие решения в найме перестают работать.

Я собрал три графика: динамику hh.индекса и два трейсера — по hh.индексу и по безработице. Первый отвечает больше за температуру рынка со стороны вакансий и резюме, а второй — за контроль: не превращается ли всё это в ухудшение занятости.

Читать далее

Математика постпраздничного выживания: оптимизируем личные финансы и силы после Нового Года с помощью MATLAB

Уровень сложностиСложный
Время на прочтение16 мин
Охват и читатели10K

Аннотация

Бум-бум-бум — отзвучали куранты. Бенгальские огни догорели, мандарины съедены, а праздничное настроение постепенно растворяется в утреннем кофе. Наступает момент истины: счет в банке вызывает легкую панику, а мысль о рабочих задачах кажется невыполнимой миссией. Знакомо?

2 января 2026 года — не время для паники или пустых обещаний. Это идеальный момент для холодного, математического аудита последствий. Проблема не в отсутствии силы воли, а в одновременной атаке двух системных «врагов»:

Финансовый провал. Ваша функция Budget(t) достигла локального (а для кого-то и глобального) минимума. Остаток стремится к нулю или ушёл в отрицательную область, а входящий поток средств пока не восстановился.

Энергетическая яма. Ваша функция Energy(t) находится в глубоком провале. Режим сна сбит, когнитивные способности притуплены праздничной энтропией, а мотивация асимптотически приближается к оси абсцисс.

Традиционный подход — сделать для себе строгие рамки («с понедельника на диету и в спортзал!») — является попыткой решить задачу скачкообразным изменением граничных условий. История и теория систем показывают, что такие методы часто приводят к срывам и новым минимумам.

Сегодня мы не будем заниматься самокопанием или ставить эмоциональные цели. Мы поступим как инженеры и математики. Мы построим в MATLAB простую, но наглядную динамическую модель двойного восстановления. Её цель — наглядно показать, как разные стратегии управления расходами Spend(t) проводят нас из начальной точки [B(0) ≈ 0, E(0) << 1] к целевой области «финансовая стабильность + работоспособность» за минимальное время и с наименьшими психологическими потерями.

Мы промоделируем три сценария, найдем компромиссную кривую и получим математически обоснованный ответ на вопрос: «Как правильно выходить из праздников?».

Читать далее

CUPED на практике: когда помогает, когда мешает и что проверить перед применением

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели8.4K

CUPED часто рекомендуют как простой способ сделать A‑B тесты чувствительнее, но в реальных экспериментах он может как помочь, так и навредить. Причины почти всегда практические: историческая ковариата пересекается по времени с экспериментом, отличается единица анализа, есть пропуски или выбросы настолько велики и значительны, что оценка коэффициента становится неустойчивой.

В этом разборе я покажу CUPED на примерах, близких к продовым метрикам вроде выручки на пользователя. Мы посмотрим, почему стандартный анализ плохо работает при выбросах, как меняется ширина доверительных интервалов при добавлении CUPED, и что происходит с мощностью и ошибкой первого рода. Отдельный акцент — как выбирать исторические данные для ковариаты и как не поймать утечку воздействия в предэкспериментальный период. В конце практический набор проверок, чтобы CUPED был полезным инструментом, но не источником искаженных выводов.

Читать далее

Классификация требований к ПО в виде иерархии

Время на прочтение6 мин
Охват и читатели7.6K

Цель статьи — провести классификацию и иерархическое деление требований на группы с конкретными примерами из лабораторной практики. Разделение требований на группы и подгруппы необходимо для правильного построения проектного решения, основанного на анализе требований, а не на "представлениях о хорошем". Особенно это актуально для систем, подчиняющихся строгим стандартам, таким как ГОСТ ISO/IEC 17025-2019, который устанавливает общие требования к компетентности, беспристрастности и стабильной работе лабораторий.

Я провожу обучения и консультации для лабораторий, которые хотят автоматизировать часть своей деятельности и внедрить ЛИМС или адаптировать имеющиеся системы под задачи лаборатории. Естественно, что в самом начале я делаю акцент на необходимости правильной постановки цели автоматизации и разработке технического задания. В это время всегда появляется необходимость разделения требований на группы с определенной иерархией. Проанализировав разные подходы и классификации, я пришел к тому, что проще начать с дихотомического деления на функциональные и нефункциональные требования.

Читать далее

Как с помощью causal inference в Авито показали влияние обращений в поддержку на опыт пользователя

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели6.2K

Привет! Меня зовут Яша Финкельберг, я senior аналитик в Авито. Для оценки удовлетворённости и состояния клиентской базы часто используют пользовательский опыт (User Experience, UX) — общее восприятие продукта пользователем.

Для оценки опыта продавцов мы используем сочетание инструментов — регулярные опросы, метрики CES и CSAT. Но чтобы глубже понять драйверы негативного опыта, мы начали анализировать и обращения в поддержку — Contact Rate.

В этой статье рассказываю, как мы оцифровали влияние обращения в поддержку на опыт продавцов и почему для этого нам понадобились методы причинно-следственного анализа (causal inference).

Читать далее

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за декабрь 2025 года

Время на прочтение6 мин
Охват и читатели7.3K

В декабре 2025 года информационная служба Хабра выпустила 905 публикаций (854 новости и поста, 11 лонгридов и 40 переводов). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Директор спрашивает «почему маржа упала» — как ответить цифрами

Время на прочтение6 мин
Охват и читатели8.7K

Привет, аналитики!

Публикую 30 декабря — когда все нормальные люди режут оливье. Но если вы это читаете, значит, тоже из тех, кто 2 января откроет ноутбук проверить дашборды. Для нас и пишу.

В прошлой статье разбирали, какие метрики выбирать для ритейла. Допустим, вы собрали нужные KPI, построили дашборды - а директор спрашивает: «Маржа выросла на 3 млн. За счёт чего?»

Показать рост - просто. Объяснить причину - сложнее. Выросла выручка, но упала маржинальность. Увеличился трафик, но просела конверсия. Как это влияет на итог в рублях?

Расскажу про дашборд факторного анализа продаж. Он показывает не «было — стало», а раскладывает изменение маржи по каждому фактору: от трафика до среднего чека.

Сегодня рассмотрим:

Читать далее

Зачем нужны аналитики?

Время на прочтение4 мин
Охват и читатели8.4K

Я работаю системным и бизнес-аналитиком, но периодически вижу обсуждения, что аналитики не нужны, либо не нужны били изначально, потому что DDD и вот это всё, либо не нужны становятся сейчас из-за развития нейросетей и трансформации разработки. Однако на своем опыте я вывел несколько причин, почему аналитики всё таки нужны:

Разделение труда - системный и бизнес-аналитик это результат разделения труда и специализации. Естественный процесс в любой деятельности, где работает больше трех человек.

Дешевая замена - аналитики в рамках выделения своей ролевой специфики часто выступают для сокращения затрат на разработчиков.

Тушитель пожаров - аналитики на проектах часто выступают в роли затыкателя дыр, выполняя все возможные временные функции от тестировщика до тех.писа.

Собиратели конструкторов - аналитики заменяют разработку в проектах с лоу-код и ноу-код конструкторами.

Вайб-кодеры - в настоящее время за счет нейросетей аналитик может самостоятельно тестировать идеи в коде и прототипах вообще без разработчиков.

Далее рассмотрим подробнее.

Ускоряем загрузку данных в BI в 2 раза: кейс команды VK

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели2.5K

Apache Superset — востребованное open-source решение для анализа данных, которое можно быстро установить и встроить в существующий технологический стек компании благодаря большому количеству коннекторов и видов визуализаций. Однако для высоконагруженных систем и сложных сценариев некоторые компании дорабатывают исходную версию, например внедряют инструменты автоматического кеширования и оптимизируют архитектуру хранения данных для построения графиков. По этому пути в своё время пошли и мы в VK.

Привет, Хабр. Меня зовут Никита Романов, лидирую разработку аналитических инструментов VK. В этой статье расскажу о нашем опыте оптимизации Apache Superset под свои задачи.

Читать далее

Press F: технологии, которые мы потеряли в 2025 году

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели103K

За этот год в мире технологий произошло много событий: доминирование ИИ, битвы за кибербезопасность и стратегические приобретения переопределили технологический ландшафт. Но некоторые крупные продукты и услуги не пережили и середины года. Одни из них прожили долгую плодотворную жизнь и оставили неизгладимый след в истории. Другие оказались мимолетными проектами или полными провалами, которым было суждено встретить свою неизбежную кончину. Тем не менее, все они достойны того, чтобы их помнили за то, как они повлияли на нашу жизнь — даже если это влияние было лишь в ленте новостей.

Пришло время еще раз оглянуться назад и вспомнить технологии, которые ушли в 2025 году. От таких столпов, как Skype, до устройств с ИИ, у которых не было ни единого шанса, все из этого списка отправилось на технологическую свалку за последние 12 месяцев.

Читать далее

Ближайшие события

Страх и ненависть в бизнес-анализе: сравниваем теорию и реальность

Время на прочтение11 мин
Охват и читатели8K

Привет, Хабр! Меня зовут Артем Евтеев, я ведущий аналитик в МТС Web Services. Кажется, каждый бизнес-аналитик (и не только) хотя бы раз в жизни слышал о книге «Разработка требований к программному обеспечению» Карла Вигерса и Джой Битти.

В очередной раз собрался освежить в памяти теорию — и меня посетила мысль: а насколько изложенное в «инструкции бизнес-аналитика» действительно перекликается с реальностью? Как часто эта «настольная книга» подходит для решения рабочих задачах?

В жизни теория нередко сочетается с практикой. Но так ли это в профессии бизнес-аналитика в ИТ-компании — предлагаю разобраться. 

Читать далее

Сколько теперь серверов Google Global Cache в России?

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели13K

В июле прошлого года я считал сколько в России было серверов GGC на сетях крупнейших операторов связи. Повторил подсчет в декабре 2025, а также закинул пару инсайдов от знакомых из крупных телекомов.

Читать далее

Как я написал телеграм бота для отбора лучших криптоактивов для торговли

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели7.6K

Рынок криптовалют характеризуется высокой волатильностью и большим количеством одновременно торгуемых инструментов. Для трейдера ключевой проблемой становится не столько поиск точки входа, сколько предварительный отбор активов, на которые вообще стоит обращать внимание. Ручной анализ десятков графиков требует значительных временных затрат и неизбежно приводит к субъективным ошибкам. Особенно актуально это стало на текущем крипторынке - в декабре, да и в целом во второй половина 2025 года, было огромное количество периодов с околонулевой волатильностью, что делает качественную торговлю невозможной.

Целью данной работы стало создание автоматизированного скрипта, который позволяет в реальном времени отбирать криптоактивы с признаками повышенного интереса со стороны участников рынка. В основе подхода лежит анализ динамики открытого интереса (Open Interest) и его соотношения с движением цены. В качестве платформы для оповещений я выбрал telegram - настроим бота, который будет присылать уведомления по необходимым активам.

Читать далее

Возможность завести себе мини-Дурова по акции, а также крипто-оттепель в РФ

Время на прочтение6 мин
Охват и читатели16K

Самые интересные новости финансов и технологий в России и мире за неделю: ЦБ решил позволить неквалам покупать криптовалюту, на Роскомнадзор подали в суд за блокировку мессенджеров, Маску наконец вернули бонус за Теслу, новая цензура для китайских нейросетей, а также взлом браузерного расширения Trust Wallet.

Читать далее

Вы строите Lakehouse, а сторадж строит вам проблемы. Что делать?

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели12K

Всем привет! Меня зовут Дмитрий Листвин, я занимаюсь аналитическим хранилищем данных в Авито.

В этой статье я собрал наш опыт построения Lakehouse поверх объектного хранилища, как реальная аналитическая нагрузка быстро превращает «обычный S3» в самый капризный элемент всей архитектуры. Будет много про извлечение максимума производительности из Ceph: как добиться высокой пропускной способности HDD, когда поверх данных хочется запускать тяжёлые аналитические запросы.

Читать далее

CUPED и пост-стратификация: выход в стратосферу

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели5.8K

Привет, Хабр!

Меня зовут Евгений Пантелеев. Я занимаюсь аналитикой в Авито Авто в сегменте Resellers.

Каждый день мы с командой сталкиваемся с необходимостью измерения небольшого инкремента (в районе 1%) от CRM-коммуникаций на изменчивой выборке пользователей в условиях долгосрочного эксперимента (до 6 месяцев). При этом нам важно минимизировать размер контрольной группы, не жертвуя статистической значимостью результата.

В этой статье я покажу, как нам удалось усилить классический метод CUPED за счет эмпирического подбора оптимального предпериода и применить пост-стратификацию на основе бизнес-логики. Этот подход позволил нам получить статистически значимый результат и запланировать дальнейшее сокращение контрольной группы.

Читать далее

Люди! Делайте же нормальные файлы EXCEL! (ч.2)

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели27K

Начало тут

По своей сути, каждая новая экселька это отдельный мирок. Я бы даже выразился "некая от отдельная приложуха"! И чтобы она была живой, понятной не только тебе и действительно стала полезным инструментом ты должен понять, а на какой вопрос она отвечает?

Это не совсем ТЗ. Тех.задание (пусть и самому себе) ты будешь продумывать в голове на следующем шаге. А это чуть более глубокий вопрос: какую именно потребность ты закроешь в самом конце, проделав кучу работы, всё собрав, подсчитав и отформатировав?

Читать далее