Все потоки

Статистика в IT

Статистика, исследования, тенденции

76,99

Рейтинг

СтатьиПостыНовостиАвторыКомпании

ph_piter 8 часов назад

Книга: «Думай как аналитик. Статистика и данные с примерами на Python. 3-е изд.»

2 мин

4.6K

Блог компании Издательский дом «Питер»Профессиональная литература * Python * Статистика в IT

Привет, Хаброжители! Умение писать код — это все, что нужно, чтобы извлекать из данных ценные выводы и находить ответы на сложные вопросы. В этом полностью переработанном издании статистические концепции представлены не в виде громоздких математических формул, а как стройный вычислительный процесс на языке Python. На практических примерах с использованием реальных датасетов изучите весь цикл разведочного анализа данных — от первичной обработки данных и подсчета статистик до выявления закономерностей и проверки гипотез.

Читать далее

+8

TraPhro 23 часа назад

О производителях микросхем памяти

4 мин

11K

Читальный залФинансы в ITУчебный процесс в ITСтатистика в IT

Перевод

Майкл Бьюрри, прославившийся благодаря книге и фильму «Игра на понижение» (The Big Short), не разделяет популярную точку зрения о том, что производители микросхем памяти вступили в новый «суперцикл». И в его аргументах есть логика.

Читать далее

+2

mikhailshpakov 14 июл в 08:05

Что я узнал за год, мониторя 6 500 сайтов: 108 312 падений в цифрах

Простой

6 мин

8.1K

Блог компании Timeweb CloudСтатистика в ITСерверное администрирование * DevOps *

Аналитика

Привет, Хабр! Меня зовут Михаил Шпаков, я руковожу разработкой в Timeweb Cloud и развиваю Statuser — сервис мониторинга доступности сайтов, который когда-то начинался как вечерний pet-проект. Я уже рассказывал, как он появился, как в нём выросли статус-пейджи и зачем я научил его следить за DNS.

Той самой первой статье недавно исполнился год. Мне захотелось отметить эту дату не праздничным постом, а в духе самого Statuser: цифрами. Повод удачно совпал с устройством сервиса. Историю инцидентов он хранит ровно год, так что в базе меня ждал аккуратный годовой датасет: 108 312 инцидентов с июля 2025-го по июль 2026-го. По сути, готовая статистика о том, как живёт и падает обычный сайт.

Я залез в эти данные и хочу поделиться тем, что нашёл. Почему сайты падают на самом деле, в какое время это происходит, сколько длится типичное падение и что за странная аномалия случилась этим июнем.

Читать далее

+23

TraPhro 4 июл в 18:05

Игра проигравшего

4 мин

16K

Читальный залФинансы в ITУчебный процесс в ITУправление проектами * Статистика в IT

Саймон Рамо - сын русской иммигрантки, отец межконтинентальной баллистической ракеты США и бизнесмен. Однажды он захотел улучшить свою игру в теннис и применил тот же строгий, основанный на фактических данных подход, который когда-то привел его к успешной карьере.

В результате в 1970 году им была написана книга «Необыкновенный теннис для обыкновенного игрока».

Читать далее

+28

newpavlov 1 июл в 12:55

IT-пузырь лопнул: почему одни айтишники не могут найти работу, а других всё равно не хватает

Простой

4 мин

59K

Карьера в IT-индустрииIT-компанииИсследования и прогнозы в IT * IT-стандарты * Статистика в IT

Аналитика

В начале 2026 года произошло что-то странное. Количество IT-вакансий упало на треть, кандидаты месяцами не могут найти работу, джуны рассылают по сотне откликов без ответа - и при этом 64% российских работодателей говорят, что им катастрофически не хватает IT-специалистов.

Это не противоречие. Это новая реальность российского IT-рынка, в которой одновременно верны два тезиса: людей слишком много и людей катастрофически не хватает.

В этой статье мы пытаемся разобраться, как так получилось и что будет дальше.

Читать далее

-32

denis-19 1 июл в 07:03

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за июнь 2026 года

6 мин

5.9K

Учебный процесс в ITКонтент и копирайтинг * Статистика в ITHabrНаучно-популярное

Дайджест

В июне 2026 года информационная служба Хабра выпустила 944 публикации (880 новостей и постов, 8 лонгридов и 56 переводов). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

+6

schlehe 30 июн в 14:16

Как мы во Flowwow выстроили систему метрик разработки и зачем это бизнесу

5 мин

7.5K

Блог компании FlowwowУправление разработкой * Управление продуктом * Статистика в IT

Кейс

Сегодня расскажу о том, как мы внедряли процессные метрики в компании: с чего начали, какие сложности поймали по дороге и какие выводы сделали. А главное — покажу, какой эффект это дало для команд, скорости разработки и бизнеса в целом.

Читать далее

+5

newpavlov 24 июн в 11:27

5 IT-профессий, которые AI сделал ненужными — и 5, на которых можно заработать сейчас

Простой

6 мин

8.7K

Исследования и прогнозы в IT * Искусственный интеллектСтатистика в ITIT-компанииКарьера в IT-индустрии

Помните, как года два назад все вокруг говорили про промпт-инженеров? Шестизначные зарплаты, никакого кода, просто «умей разговаривать с нейросетью». Казалось, вот оно - профессия будущего.

Сегодня этих вакансий почти не существует.

Рынок труда в IT меняется быстрее, чем большинство людей успевают переучиться. И это уже не страшилки из LinkedIn - это реальные данные, которые мы собрали, чтобы разобраться: что реально произошло, и куда двигаться дальше.

Читать далее

+7

MalwareAI 23 июн в 16:12

Claude Code Antifraud: Колмогоров‑Смирнов и недетские аномалии на детской олимпиаде

Средний

46 мин

23K

Открытые данные * Учебный процесс в ITСтатистика в ITИскусственный интеллект

Аналитика

Из песочницы

Приходит ко мне как-то знакомый с импортным за 300р. «Слушай, – говорит, – ты ж антифрод-эксперт. Проверь, пожалуйста, школьную олимпиаду. У меня сын ходил, что-то результаты странные».

Триста за импортное – серьёзная заявка. Ну что ж, триста так триста. Погнали.

Читать далее

+93

DanikNik 23 июн в 10:13

Switchback-тесты: инфраструктура для экспериментов в условиях сетевых эффектов

Простой

17 мин

11K

Блог компании AvitoTechТестирование IT-систем * Тестирование веб-сервисов * Статистика в ITBig Data *

Обзор

Меня зовут Даниил Никольский, я бэкенд-инженер команды Trisigma. В создании статьи участвовали Искандер Мирмахмадов, руководитель продуктового направления, и Александр Кузнецов, старший аналитик. В этой статье я расскажу про Switchback-эксперименты, рассмотрим как они устроены, почему для него не подходит обычный t-тест, и какая инфраструктура нужна, чтобы проводить такие эксперименты в промышленном масштабе.

Решение доступно всем желающим по ссылке, а тут можно познакомиться с подробной технической документацией.

Читать далее

+35

That_Vlad 22 июн в 11:56

От имени Габенбота: измеряем во сколько обошёлся призыв оставить отзыв

Средний

11 мин

7.4K

Разработка игр * Data Mining * Игры и игровые консолиСтатистика в IT

Аналитика

Из песочницы

Перевод

Игра Far Far West просила игроков оставить отзыв прямо через внутриигрового NPC — прямое нарушение правил Steam. Мы выгрузили данные и прогнали через модели детекции аномалий, чтобы посчитать, сколько отзывов оказались «добавленными». Спойлер: от 27% до 50%.

Читать далее

+7

TatarnikovEgor 21 июн в 18:32

Когда лучше публиковаться на Хабре. Статистический анализ связи времени публикации и охвата статей

Простой

7 мин

14K

Исследования и прогнозы в IT * Статистика в IT

Аналитика

На Хабре сейчас высокая конкуренция среди авторов за внимание читателей. По данным самого Хабра, в 2025 году на сайте было более 10 тысяч уникальных авторов контента, а количество публикаций превысило 51 тысячу. Это означает, что даже качественный материал может не получить заметный охват из-за большого количества публикаций в ленте.

Есть распространённое мнение, что публиковать статьи нужно в предобеденное время, чтобы люди на обеденном перерыве могли почитать эти статьи, тогда охват будет максимальным. Но так как этого правила придерживаются многие, возникает высококонкурентная среда, где за час публикуются десятки статей. При этом публикации, размещённые ночью, также нередко набирают высокий охват, несмотря на ожидаемо низкую активность пользователей в это время.

Возникает вопрос:

Связано ли время публикации с охватом аудитории, и если да, то когда статьи набирают больший охват?

Поэтому я решил провести исследование:

На основе данных ленты Хабра проверить, связано ли время публикации статьи с её охватом, и определить временные интервалы, в которые статьи набирают больший охват.

Читать далее

+32

nnazarov 18 июн в 09:00

Линеаризация. Увеличиваем мощность А/Б тестов с метрикой отношения

7 мин

7.6K

Блог компании X5 TechPython * Веб-аналитика * Статистика в ITМатематика *

Туториал

Статья о том, как линеаризация помогает оценивать А/Б тесты с метриками отношения и повышать чувствительность экспериментов.

Разберём применение линеаризации на примере эксперимента со средним чеком. Построим доверительный интервал для метрики отношения. Проверим корректность работы линеаризации и покажем, в каких случаях её эффективность может снизиться. Убедимся, что CUPED увеличивает мощность критерия, и обсудим как линеаризовать ковариату.

Читать далее

+13

ph_piter 10 июн в 12:40

Моделирование распределений

8 мин

8.7K

Блог компании Издательский дом «Питер»Профессиональная литература * Python * Математика * Статистика в IT

Привет, Хаброжители! Мы открыли предзаказ на книгу «Думай как аналитик. Статистика и данные с примерами на Python. 3-е изд.», хотим немного рассказать вам о ней и поделиться интересным отрывком.

Читать далее

+9

newpavlov 10 июн в 12:11

Кому легче найти работу в IT? Мы разобрали 1 000 000 откликов и ответ вас удивит

Простой

5 мин

7.8K

IT-компанииСтатистика в ITКарьера в IT-индустрииИсследования и прогнозы в IT * IT-инфраструктура *

Аналитика

Привет, Хабр!

При выборе IT-направления обычно смотрят на два параметра: зарплату и количество вакансий. Но это неполная картина - и это можно доказать цифрами.

Я пишу от лица команды Софи - ИИ-ассистента для автоматизации откликов на вакансии.

За 11 месяцев работы мы сделали миллион реальных откликов кандидатов - с ответами рекрутеров, тестовыми заданиями и приглашениями на интервью. Всё это осело в базе данных.

В статье мы используем эти данные, чтобы ответить на вопрос, который волнует каждого, кто сейчас в поиске: в каком IT-направлении выше реальная вероятность дойти до оффера.

Погнали!

Узнать результаты

+8

vanderwardan 9 июн в 11:14

Почему A/B-тест не подходит для оценки ранжирования и что с этим делать

Средний

8 мин

13K

Блог компании AvitoTechСтатистика в ITАнализ и проектирование систем * Big Data * Поисковые технологии *

Кейс

Всем привет! Меня зовут Вардан Манучарян, я аналитик в команде Монетизации Авито, и мы отвечаем за механику алгоритмов продвижения, то есть управляем порядком, в котором пользователи видят объявления. Для этого нам нужно отслеживать, как изменения в ранжировании влияют на бизнес и покупателей. В этой статье расскажу про интерливинг, — метод, который помогает корректно проводить A/B-тесты с изменением ранжирования. Статья будет интересна аналитикам, которые проводят много A/B-тестов.

Читать далее

+30

maximslav 4 июн в 14:04

Линейная регрессия на стероидах: Double Machine Learning для устранения смещений в данных

Средний

18 мин

11K

Big Data * Машинное обучение * Python * Статистика в ITАналитика мобильных приложений *

Туториал

Из песочницы

Любой аналитик знает, что самым надёжным способом проверки гипотез являются рандомизированные контролируемые эксперименты (RCT), или, как их называют в народе — A/B-тесты. На практике часто возникают ситуации, когда провести A/B-тест невозможно — в основном это происходит по этическим или техническим причинам. Однако бывают кейсы, когда рандомизация невозможна потому, что treatment-ом является определённое действие пользователя. Например, treatment-ом может быть оформление платной подписки или отмена бронирования на сервисе. Давайте назовём такой вид воздействия добровольным.

В русскоязычном пространстве, и в частности на Хабре, достаточно много статей, посвящённых таким методам Causal Inference, как DiD, PSM и Causal Impact. Тем не менее, к моему удивлению, практически нет статей, посвящённых методам на основе ортогонализации и regression adjustment, хотя, на мой взгляд, именно эти методы являются самыми удобными для оценки эффекта от добровольного treatment-а. Пришло время исправить это недоразумение и разобрать метод Double/Debiased Machine Learning (DML) и Partial Linear Regression для задач Causal Inference!

Читать далее

+13

andruwkach 2 июн в 12:15

Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A/B на малых выборках

Средний

20 мин

15K

Блог компании AvitoTechМатематика * Машинное обучение * Статистика в ITИскусственный интеллект

Туториал

Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию.

В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.

В A/B-тестах на малых выборках стандартные проблемы усиливаются: MDE выше ожидаемого эффекта, метрики шумят, а эффект трудно отделить от случайности. При этом страдает не только чувствительность, но и валидность: из-за небольшого числа наблюдений любая ошибка в дизайне, балансе групп или интерпретации результата становится гораздо опаснее.

В материале дам 26 шагов, которые помогут выжать максимум чувствительности и валидности из ограниченной выборки. Хотя фокус — на A/B-тестах с малыми выборками, 90% подходов применимы и к стандартным экспериментам.

Читать далее

+34

denis-19 1 июн в 04:40

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за май 2026 года

6 мин

8.1K

Учебный процесс в ITКонтент и копирайтинг * HabrНаучно-популярноеСтатистика в IT

Дайджест

В мае 2026 года информационная служба Хабра выпустила 935 публикаций (867 новостей и постов, 5 лонгридов и 63 перевода). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

+6

Diana1991 29 мая в 09:42

Юмор в IT правда специфический? Результаты исследования

Простой

8 мин

7.3K

Блог компании КонтурИсследования и прогнозы в IT * Программирование * Статистика в ITIT-компании

Аналитика

Привет! Меня зовут Диана, я редактор и деврел в Контуре. В апреле запустила небольшое исследование про юмор в IT: опросила контуровцев и внешних пользователей, шутят ли они на работе и на какие темы, в чём специфика айтишного юмора и приемлемы ли для ребят чёрные шутейки. А ещё, я нашла три самых популярных и часто упоминаемых мема! — их можно было прикрепить по желанию в конце опросника. Приглашаю почитать результаты исследования и посмотреть на мемы.

Читать далее

+5

1

2 3 ...