Обновить
72.85

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга
Уровень сложности

Учимся предсказывать конверсию в завершение опроса. Часть 1

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели3.7K

Всем привет! На связи Ульяна Айкович и Даниил Гурин — исследователи «БКС Мир инвестиций». Сегодня мы хотим поделиться результатами нашего небольшого, но довольно смелого эксперимента — попытки предсказать конверсию в прохождение опросов.

Каждый исследователь знает, как трудно удержать внимание респондентов. Особенно в опросах. Один лишний вопрос, одна лишняя картинка в анкете или лишняя минута времени для заполнения опроса — и человек закрывает вкладку. А ведь каждый ответ на вес золота. Поэтому мы решили разобраться: что именно определяет, дойдет ли человек до конца опроса или бросит его на полпути? Можем ли мы заранее это предсказать?

В статье более подробно рассказали о первой итерации нашего эксперимента!

Статья, полезные ссылки и литература

Новости

Как построить дерево метрик? Разбираем на примере сервиса доставки еды

Время на прочтение3 мин
Охват и читатели8.4K

Как не потеряться в сотнях графиков и найти реальные рычаги влияния на бизнес? В статье представлен подробный разбор Дерева метрик на примере FoodTech-сервиса (доставки еды). Мы уходим от простого мониторинга цифр к системной декомпозиции North Star Metric.

Читать далее

Использование машинного обучения при диагностике КИП и динамического оборудования

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели8K

Современный мир переживает бум развития технологий искусственного интеллекта, помимо чат-ботов, сервисов генерации изображений и т.п. Искусственный интеллект (ИИ) применяется в беспилотных автомобилях, которые уже сейчас ездят по дорогам общего пользования. Это пример того, как ИИ управляет техническим средством, а именно, считывает данные с лидаров и видеокамер и т.п., анализирует их и формирует команды для задания направления и скорости движения автомобиля. На первый взгляд, это мало чем принципиально отличается от управления технологическим оборудованием на промышленных предприятиях. Почему же в современных АСУ ТП не применяют ИИ для формирования управляющих воздействий на исполнительные механизмы?

Читать далее

Последовательный анализ в AB-тестировании: ускоряем принятие решений с помощью mSPRT

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели7.3K

Как часто бизнес задает вопрос о результатах A/B-теста уже на второй день после запуска? В классической статистике основной ответ: необходимо ждать набора фиксированной выборки, иначе риск ложноположительного результата становится неконтролируемым. Однако современные подходы позволяют не только проводить мониторинг данных без риска математической ошибки, но и останавливать эксперименты значительно раньше срока. В основе такой гибкости лежит методология mSPRT, которая превращает эксперимент из закрытого процесса в прозрачный поток данных.

Вместо пассивного ожидания можно использовать концепцию доверительных последовательностей и всегда валидных p-значений. Эти инструменты сохраняют свою математическую силу независимо от того, как часто проверяются промежуточные итоги. Ключевую роль в настройке системы играет параметр смешивания тау, который помогает найти тонкий баланс между чувствительностью к минимальным изменениям и скоростью получения итогового результата.

Работа с реальным трафиком требует адаптации теории к специфике бизнеса. В статье разбирается, как метод линеаризации помогает применять последовательный анализ к сложным показателям вроде конверсии или среднего дохода на пользователя. Также рассматриваются ситуации, когда стандартная математика может давать сбои из-за экстремальных выбросов с тяжелыми хвостами распределения или изменения характеристик трафика во времени. Чтобы исключить ложные срабатывания, вводится система защитных механизмов, которая делает выводы устойчивыми к случайному шуму.

Такой метод позволяет сократить время проведения тестов на 30-50%, не жертвуя при этом достоверностью. Это способ сделать процесс проверки гипотез более гибким и быстрым, сохраняя безупречную математическую строгость в каждой точке принятия решения.

Читать далее

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за январь 2026 года

Время на прочтение6 мин
Охват и читатели6.6K

В январе 2026 года информационная служба Хабра выпустила 842 публикации (801 новость и пост, 8 лонгридов и 33 перевода). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Критерий Манна-Уитни: о чём молчат ранги

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели4.2K

Это небольшая статья не ставит себе целью подробно и математически строго изложить все подробности. Не является она и практическим описанием алгоритмической стороны дела, так как статьи об этом пребывают в интернете в огромном количестве и без моей помощи. Это скорее попытка подсветить основные недоразумения и оградить от самых распространенных ошибок. К сожалению, приходится констатировать, что популярность и простота критерия Манна-Уитни, как это часто бывает, в итоге обернулась против него самого, что по понятным причинам стало особенно заметно в последнее время. Причем ошибки кроются не в вычислениях, а в неправильном понимании того, для чего собственно этот тест предназначен.

Далее предполагается, что читатель знаком с основами классической методологии статистической проверки гипотез и соответствующей терминологией.

****

В 1947 году появилась статья (H. Mann, D. Whitney) (1), где авторы предложили критерий, способный различать два непрерывных распределения. Таким образом, его нулевую гипотезу можно формулировать так: «Обе выборки порождены одним и тем же распределением», т.е. H0: F(t) = G(t), где F() и G() - функции распределения непрерывных случайных величин X и Y, соответственно. Обратите внимание, мы сейчас формулируем равенство именно в терминах функций распределения (cumulative distribution functions, CDF), а не плотностей (probability density functions, PDF).

Что с альтернативной гипотезой? Здесь и начинается путаница. В оригинальной статье альтернатива представлена следующим образом: HA: F(t) > G(t) (или F(t) < G(t), но далее мы, без потери общности, будем рассматривать только первый вариант). Итак, в авторской версии альтернатива состоит в том, что одна из функций распределения мажорирует другую. В более привычном для практики виде это означает, что плотность случайной величины X "смещена" влево относительно плотности Y (рис. 1).

Читать далее

Численный и математический анализ при диагностике динамического оборудования

Уровень сложностиСредний
Время на прочтение19 мин
Охват и читатели7K

В последние десятилетия наблюдается значительное усложнение технологических процессов, на промышленных предприятиях применяется всё более эффективное оборудование, которое требует более внимательного подхода к его диагностике. Следствием этого стало появление отдельного класса промышленных информационных систем – систем параметрической диагностики. Помимо систем параметрической диагностики в последнее время стали появляться Системы Поддержки Принятия Решений, которые, помимо прочих функций, успешно решают задачи диагностики. Пример такой системы мы и рассмотрим в этой статье, ориентированной на технических руководителей и эксплуатирующий персонал промышленных предприятий.

Читать далее

Тесты первого клика: как знание статистики помогает делать правильные выводы?

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.7K

На связи Ульяна Айкович, UX-исследователь и адепт статистики из БКС Мир Инвестиций. Сегодня я расскажу, в каких случаях применять статистические тесты, как легко реализовать их в гугл-таблицах, а также, как интерпретировать результат этих тестов. Не бойтесь, будет много практики и совсем немного важной теории.

В статье детально расскажем, как и когда применять биноминальный и χ²-тесты на наших кейсах.

Читать далее

Рынок видеокарт в 2026 году: дефицит, рост цен и чего ожидать

Время на прочтение5 мин
Охват и читатели6.1K

В начале 2026 года стало понятно, что с рынком видеокарт происходит что-то весьма серьезное. То, что раньше выглядело как временные перебои или спорадические скачки цен, больше не похоже на случайность. За этим стоят вполне конкретные причины — от решений производителей и до того, как сейчас распределяются мощности и ресурсы внутри отрасли. Давайте разберемся, что происходит с поставками видеокарт и к чему это в итоге приводит. Поехали!

Читать далее

AB-тесты и подглядывание: введение в последовательное тестирование

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.9K

В AB-тестах нередко возникает желание смотреть на результат по ходу эксперимента: метрики обновляются, решения ждать долго, а если эффект уже очевиден, то зачем тянуть до конца. Но в этом месте легко допустить серьезную ошибку: регулярно пересчитывать обычное p-значение и завершать тест при первом p < 0.05. Такой подход повышает долю ложных срабатываний: иногда статистическая значимость появляется просто из-за случайных колебаний данных, даже когда реального эффекта нет.

В этой статье разбираем, почему так происходит, и что с этим делают в прикладной аналитике. Покажу, как устроено групповое последовательное тестирование (group sequential): вы заранее задаете несколько контрольных точек для подглядывания, а пороги принятия решения подбираются так, чтобы общий уровень ошибки первого рода по всему процессу оставался на заданном уровне alpha.

На простых формулах и наглядных графиках из симуляций сравним наивное подглядывание с корректной процедурой. А затем разберем два самых популярных набора порогов - Pocock и OBrien-Fleming: чем они отличаются, почему один вариант чаще завершает эксперимент раньше, а другой почти не дает принимать решения в начале, и как выбрать подходящий вариант под продуктовый процесс.

Читать далее

Как проверять продуктовые гипотезы без A/B-тестов? Практические альтернативы

Время на прочтение3 мин
Охват и читатели6.6K

АБ-тесты — это дорого. Как проверять гипотезы, если у вас нет времени или трафика. АБ-тестирование давно закрепилось как «золотой стандарт» проверки гипотез. Но у него есть обратная сторона: это дорого, долго и требует огромного трафика для достижения статистической значимости. Иногда бизнес просто не может позволить себе ждать месяц, чтобы узнать, что кнопка «Купить» должна быть синей.

Читать далее

Как медь стала узким местом для ЦОД и энергетики и что с этим делать

Время на прочтение6 мин
Охват и читатели17K

Медь постепенно превращается в узкое место для современной энергетической и вычислительной инфраструктуры. Без нее не работают кабели, трансформаторы, распределительные шины и системы охлаждения — все то, что подводит энергию и отводит тепло от оборудования. Спрос на металл растет сразу по нескольким направлениям: строятся крупные дата-центры, ускоряется электрификация транспорта, расширяется возобновляемая энергетика. Короче, медь — бутылочное горлышко развития сразу нескольких отраслей. И оно постепенно сужается.

Согласно отчету S&P Global, глобальный спрос на медь вырастет на 50% к 2040 году, с 28 миллионов тонн в 2025 году до 42 миллионов. Основные драйверы роста здесь — базовая экономика, переход на чистую энергию и модернизация сетей. Искусственный интеллект (куда ж без него ) добавит еще около 2 миллионов тонн дополнительного спроса за этот период. Без новых источников добычи и переработки общий дефицит может превысить 10 миллионов тонн в год. Давайте оценим, что происходит и насколько все это решаемо.

Читать далее

Видеокарты, NAND, процессоры, далее — везде. Почему растут цены и что с этим делать

Время на прочтение5 мин
Охват и читатели13K

Если оглянуться на последние пару лет, легко заметить: рынок компьютерного железа научился выживать в режиме постоянных встрясок — то майнинг, то пандемия, то еще что-нибудь. Но нынешний кризис оказался каким-то особенно упорным. Все началось с оперативной памяти: к концу 2025 года цены на обычные модули DDR5 в отдельных сегментах выросли в несколько раз и с тех пор продолжают ползти вверх. И это, похоже, не временный скачок. «Идеальный шторм» дефицита электронных компонентов не только не утих, но со временем стал лишь набирать силу. Давайте разберемся, в чем тут дело и есть ли шансы, что ситуация придет в норму.

Читать далее

Ближайшие события

Байесовские А/Б-тесты: связь с p-значениями

Время на прочтение19 мин
Охват и читатели7K

Показана численная близость p-значений t-теста, \chi^2-теста и U-критерия Манна-Уитни в А/Б-тестах вероятностям лучшей группы байесовских моделей. Соотношения выполняются несмотря на различия в определениях.

Читать

Симулятор смысла: почему программисты выгорают, а фаундеры нет

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели43K

Осторожно: эта статья может заставить вас задуматься, чем вы занимаетесь прямо сейчас — и вам это может не понравиться.

Читать далее

Индекс Шивы: ловушка простых правил на рынке труда

Время на прочтение7 мин
Охват и читатели8.9K

Если вакансия длиннее 7000 символов, шанс встретить в ней манипуляцию или хаос — 61.5%. Это правило «рынка лимонов» работает почти идеально.

Но оно же — ловушка.

Индекс Шивы (текст / зарплата) — это инструмент диагностики, который помогает отличить необходимую сложность от словесного шума. Датасет из 48 000 вакансий.

Читать далее

Тысяча арбитражных дел — что происходит в российском IT?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

Мы проанализировали более тысячи арбитражных исков, предъявленным к российским IT-компаниям. Нашлось много интересного и про иски, и про компании, и про арбитражные суды. Как всегда, будут классные графики и занятные выводы.

Читать далее

Вторая жизнь DDR3: как кризис памяти изменил рынок ПК

Время на прочтение5 мин
Охват и читатели9.8K

Оперативная память DDR3 — один из самых долгоживущих стандартов в истории персональных компьютеров. Он пережил переход от Windows XP к Windows 11, криптовалютный майнинг, когда модули скупали пачками, взлет DDR4 и появление сверхскоростной DDR5 с ее радужными перспективами. Причина такой стойкости простая: достаточная производительность для большинства задач при низкой себестоимости и надежной архитектуре. Спустя почти двадцать лет после дебюта в 2007 году многие считали, что этот стандарт окончательно ушел в прошлое, на полки музеев или в коробки энтузиастов ретрожелеза. 

Однако события последних месяцев показывают обратное: DDR3 переживает настоящее возрождение. Пользователи по всему миру массово возвращаются к старым модулям, продажи совместимых материнских плат выросли в разы, вторичный рынок кипит. Мало кого волнует, что это память с частотами около 1600 МГц и характеристиками, далекими от современных рекордов. Главное — она доступна, со стабильной ценой и на ней можно собрать рабочую систему в мире, где новые стандарты превратились в роскошь. Давайте разберемся, что сейчас происходит.

Читать далее

Оценка эффекта релиза, когда изменение затронуло не всех: diff-in-diff и синтетический контроль

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.1K

Когда релиз раскатан не на всех, классическая схема "до" и "после" начинает рушиться: метрика растет или падает одновременно из-за сезонности, внешнего фона и изменений в каналах, а не только из-за продукта. При этом AB теста может не быть, но данные по группам есть почти всегда: по гео, сегментам, кластерам, витринам.

В этой статье разбираю два практических подхода, которые позволяют оценить эффект релиза в таких условиях. Первый - diff-in-diff: сравниваем, насколько изменилась метрика в затронутой группе относительно контрольной, и тем самым вычитаем общий фон, который влияет на всех. Второй - синтетический контроль: строим базовую линию для затронутой группы как сумму метрик нескольких контрольных групп с весами, подобранными так, чтобы до релиза эта конструкция максимально повторяла историю затронутой группы.

Отдельный акцент на том, что обычно искажает выводы: заметный рост или падение разницы между группами до релиза, изменения состава, локальные акции или технические инциденты в контрольных группах, а также ситуации, когда базовая линия плохо повторяет период до релиза и тогда мы измеряем в основном ошибку модели, а не эффект релиза. В конце показываю, какие проверки стоит сделать, чтобы результат не держался на удачно выбранных границах периода или на одной контрольной группе.

Если в первой части мы работали с одной временной линией метрики, то здесь переходим к более распространенному случаю: несколько групп, частичная раскатка и необходимость отделить влияние релиза от общего шума.

Читать далее

Оценка эффекта релиза по истории метрики: causal impact без AB теста

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5.2K

После релиза метрика почти всегда меняется. Иногда это реальный эффект изменения, иногда - сезонность, маркетинг, внешний фон или просто шум. Если AB теста не было, а решение все равно нужно принимать, остается вопрос: как аккуратно оценить влияние релиза по истории метрики и не обмануться простым сравнением до и после.

В статье разбираю практический подход causal impact для случая, когда у нас есть одна метрика во времени и понятная дата изменения. Строим контрфакт (counterfactual) - прогноз того, какой была бы метрика без релиза - и сравниваем его с фактом. На этой основе считаем эффект в абсолютных значениях, накопленный эффект и относительный вклад в процентах.

Отдельное внимание уделяю проверкам, без которых такой анализ может превратиться в тыкву: качество прогноза на периоде до изменения, учет зависимости по времени через block bootstrap, устойчивость к выбору окна и плацебо даты, которые помогают понять, выделяется ли реальный эффект на фоне ложных интервенций.

Материал ориентирован на продуктовые задачи: когда релиз уже сделан, данные есть, а надежной оценки эффекта нет. В следующей части перейдем к более частому сценарию, когда изменение затронуло не всех, и вместо одной линии метрики у нас появляется набор линий по группам (географии, сегменты, кластеры). Там разберем синтетический контроль и diff-in-diff и частые ошибки, которые встречаются в таких данных.

Читать далее
1
23 ...