Обновить
128K+

Статистика в IT

Статистика, исследования, тенденции

144,77
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Игра проигравшего

Время на прочтение4 мин
Охват и читатели1.3K

Саймон Рамо - сын русской иммигрантки, отец межконтинентальной баллистической ракеты США и бизнесмен. Однажды он захотел улучшить свою игру в теннис и применил тот же строгий, основанный на фактических данных подход, который когда-то привел его к успешной карьере.

В результате в 1970 году им была написана книга «Необыкновенный теннис для обыкновенного игрока».

Читать далее

Новости

IT-пузырь лопнул: почему одни айтишники не могут найти работу, а других всё равно не хватает

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели49K

В начале 2026 года произошло что-то странное. Количество IT-вакансий упало на треть, кандидаты месяцами не могут найти работу, джуны рассылают по сотне откликов без ответа - и при этом 64% российских работодателей говорят, что им катастрофически не хватает IT-специалистов.

Это не противоречие. Это новая реальность российского IT-рынка, в которой одновременно верны два тезиса: людей слишком много и людей катастрофически не хватает.

В этой статье мы пытаемся разобраться, как так получилось и что будет дальше.

Читать далее

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за июнь 2026 года

Время на прочтение6 мин
Охват и читатели5.2K

В июне 2026 года информационная служба Хабра выпустила 944 публикации (880 новостей и постов, 8 лонгридов и 56 переводов). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Как мы во Flowwow выстроили систему метрик разработки и зачем это бизнесу

Время на прочтение5 мин
Охват и читатели7.3K

Сегодня расскажу о том, как мы внедряли процессные метрики в компании: с чего начали, какие сложности поймали по дороге и какие выводы сделали. А главное — покажу, какой эффект это дало для команд, скорости разработки и бизнеса в целом.

Читать далее

5 IT-профессий, которые AI сделал ненужными — и 5, на которых можно заработать сейчас

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.6K

Помните, как года два назад все вокруг говорили про промпт-инженеров? Шестизначные зарплаты, никакого кода, просто «умей разговаривать с нейросетью». Казалось, вот оно - профессия будущего.

Сегодня этих вакансий почти не существует.

Рынок труда в IT меняется быстрее, чем большинство людей успевают переучиться. И это уже не страшилки из LinkedIn - это реальные данные, которые мы собрали, чтобы разобраться: что реально произошло, и куда двигаться дальше.

Читать далее

Claude Code Antifraud: Колмогоров‑Смирнов и недетские аномалии на детской олимпиаде

Уровень сложностиСредний
Время на прочтение39 мин
Охват и читатели22K

Приходит ко мне как-то знакомый с импортным за 300р. «Слушай, – говорит, – ты ж антифрод-эксперт. Проверь, пожалуйста, школьную олимпиаду. У меня сын ходил, что-то результаты странные».

Триста за импортное – серьёзная заявка. Ну что ж, триста так триста. Погнали.

Читать далее

Switchback-тесты: инфраструктура для экспериментов в условиях сетевых эффектов

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели11K

Меня зовут Даниил Никольский, я бэкенд-инженер команды Trisigma. В создании статьи участвовали Искандер Мирмахмадов, руководитель продуктового направления, и Александр Кузнецов, старший аналитик. В этой статье я расскажу про Switchback-эксперименты, рассмотрим как они устроены, почему для него не подходит обычный t-тест, и какая инфраструктура нужна, чтобы проводить такие эксперименты в промышленном масштабе.

Решение доступно всем желающим по ссылке, а тут можно познакомиться с подробной технической документацией.

Читать далее

От имени Габенбота: измеряем во сколько обошёлся призыв оставить отзыв

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели7.2K

Игра Far Far West просила игроков оставить отзыв прямо через внутриигрового NPC — прямое нарушение правил Steam. Мы выгрузили данные и прогнали через модели детекции аномалий, чтобы посчитать, сколько отзывов оказались «добавленными». Спойлер: от 27% до 50%.

Читать далее

Когда лучше публиковаться на Хабре. Статистический анализ связи времени публикации и охвата статей

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели14K

На Хабре сейчас высокая конкуренция среди авторов за внимание читателей. По данным самого Хабра, в 2025 году на сайте было более 10 тысяч уникальных авторов контента, а количество публикаций превысило 51 тысячу. Это означает, что даже качественный материал может не получить заметный охват из-за большого количества публикаций в ленте.

Есть распространённое мнение, что публиковать статьи нужно в предобеденное время, чтобы люди на обеденном перерыве могли почитать эти статьи, тогда охват будет максимальным. Но так как этого правила придерживаются многие, возникает высококонкурентная среда, где за час публикуются десятки статей. При этом публикации, размещённые ночью, также нередко набирают высокий охват, несмотря на ожидаемо низкую активность пользователей в это время.

Возникает вопрос:

Связано ли время публикации с охватом аудитории, и если да, то когда статьи набирают больший охват?

Поэтому я решил провести исследование:

На основе данных ленты Хабра проверить, связано ли время публикации статьи с её охватом, и определить временные интервалы, в которые статьи набирают больший охват.

Читать далее

Линеаризация. Увеличиваем мощность А/Б тестов с метрикой отношения

Время на прочтение7 мин
Охват и читатели7.4K

Статья о том, как линеаризация помогает оценивать А/Б тесты с метриками отношения и повышать чувствительность экспериментов.

Разберём применение линеаризации на примере эксперимента со средним чеком. Построим доверительный интервал для метрики отношения. Проверим корректность работы линеаризации и покажем, в каких случаях её эффективность может снизиться. Убедимся, что CUPED увеличивает мощность критерия, и обсудим как линеаризовать ковариату.

Читать далее

Моделирование распределений

Время на прочтение8 мин
Охват и читатели8.5K

Привет, Хаброжители! Мы открыли предзаказ на книгу «Думай как аналитик. Статистика и данные с примерами на Python. 3-е изд.», хотим немного рассказать вам о ней и поделиться интересным отрывком.

Читать далее

Кому легче найти работу в IT? Мы разобрали 1 000 000 откликов и ответ вас удивит

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.7K

Привет, Хабр!

При выборе IT-направления обычно смотрят на два параметра: зарплату и количество вакансий. Но это неполная картина - и это можно доказать цифрами.

Я пишу от лица команды Софи - ИИ-ассистента для автоматизации откликов на вакансии. 

За 11 месяцев работы мы сделали миллион реальных откликов кандидатов - с ответами рекрутеров, тестовыми заданиями и приглашениями на интервью. Всё это осело в базе данных.

В статье мы используем эти данные, чтобы ответить на вопрос, который волнует каждого, кто сейчас в поиске: в каком IT-направлении выше реальная вероятность дойти до оффера.

Погнали!

Узнать результаты

Почему A/B-тест не подходит для оценки ранжирования и что с этим делать

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели13K

Всем привет! Меня зовут Вардан Манучарян, я аналитик в команде Монетизации Авито, и мы отвечаем за механику алгоритмов продвижения, то есть управляем порядком, в котором пользователи видят объявления. Для этого нам нужно отслеживать, как изменения в ранжировании влияют на бизнес и покупателей. В этой статье расскажу про интерливинг, — метод, который помогает корректно проводить A/B-тесты с изменением ранжирования. Статья будет интересна аналитикам, которые проводят много A/B-тестов.

Читать далее

Ближайшие события

Линейная регрессия на стероидах: Double Machine Learning для устранения смещений в данных

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели11K

Любой аналитик знает, что самым надёжным способом проверки гипотез являются рандомизированные контролируемые эксперименты (RCT), или, как их называют в народе — A/B-тесты. На практике часто возникают ситуации, когда провести A/B-тест невозможно — в основном это происходит по этическим или техническим причинам. Однако бывают кейсы, когда рандомизация невозможна потому, что treatment-ом является определённое действие пользователя. Например, treatment-ом может быть оформление платной подписки или отмена бронирования на сервисе. Давайте назовём такой вид воздействия добровольным.

В русскоязычном пространстве, и в частности на Хабре, достаточно много статей, посвящённых таким методам Causal Inference, как DiD, PSM и Causal Impact. Тем не менее, к моему удивлению, практически нет статей, посвящённых методам на основе ортогонализации и regression adjustment, хотя, на мой взгляд, именно эти методы являются самыми удобными для оценки эффекта от добровольного treatment-а. Пришло время исправить это недоразумение и разобрать метод Double/Debiased Machine Learning (DML) и Partial Linear Regression для задач Causal Inference!

Читать далее

Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A/B на малых выборках

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели15K

Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию. 

В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.

В A/B-тестах на малых выборках стандартные проблемы усиливаются: MDE выше ожидаемого эффекта, метрики шумят, а эффект трудно отделить от случайности. При этом страдает не только чувствительность, но и валидность: из-за небольшого числа наблюдений любая ошибка в дизайне, балансе групп или интерпретации результата становится гораздо опаснее.

В материале дам 26 шагов, которые помогут выжать максимум чувствительности и валидности из ограниченной выборки. Хотя фокус — на A/B-тестах с малыми выборками, 90% подходов применимы и к стандартным экспериментам.

Читать далее

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за май 2026 года

Время на прочтение6 мин
Охват и читатели7.9K

В мае 2026 года информационная служба Хабра выпустила 935 публикаций (867 новостей и постов, 5 лонгридов и 63 перевода). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Юмор в IT правда специфический? Результаты исследования

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.3K

Привет! Меня зовут Диана, я редактор и деврел в Контуре. В апреле запустила небольшое исследование про юмор в IT: опросила контуровцев и внешних пользователей, шутят ли они на работе и на какие темы, в чём специфика айтишного юмора и приемлемы ли для ребят чёрные шутейки. А ещё, я нашла три самых популярных и часто упоминаемых мема! — их можно было прикрепить по желанию в конце опросника. Приглашаю почитать результаты исследования и посмотреть на мемы.

Читать далее

Сексизм в IT: данные вместо домыслов

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.5K

Привет, Хабр!

Что произойдёт, если взять два одинаковых резюме разработчиков — с одинаковым опытом, стеком и навыками — и поменять только пол кандидата?

Мы решили проверить это на практике.

Создали два аккаунта, автоматизировали отклики и отправили более 1000 на одни и те же вакансии с помощью ии-бота.

Результаты оказались одновременно и ожидаемыми, и очень странными.

Если интересно узнать, что из этого вышло — велком!

Узнать результаты

Asus, MSI и Gigabyte урезают производство материнских плат. Что происходит на рынке

Время на прочтение5 мин
Охват и читатели8.2K

В последние месяцы компьютерная индустрия обсуждает не столько новые процессоры и видеокарты, сколько неожиданное сокращение выпуска материнских плат. Asus, MSI, Gigabyte и ASRock, крупнейшие поставщики плат для домашних ПК, игровых систем и ноутбуков, пересматривают производственные планы на 2026 год в сторону заметного уменьшения.

Причина очень простая, и мы о ней уже говорили в нескольких статьях своего блога. Рынок одновременно столкнулся с ростом цен на память и накопители, снижением интереса к обновлению домашних компьютеров и перераспределением ресурсов в пользу серверной инфраструктуры для искусственного интеллекта. В результате производителям стало выгоднее сократить выпуск потребительских моделей и сосредоточиться на более прибыльных направлениях.

Читать далее

Своими руками: как посчитать квази-биномиальную логистическую регрессию и зачем это вообще нужно

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели13K

Как получить p‑value ≈ 10⁻¹⁵⁴ там, где его на самом деле нет? Разбираем феномен псевдорепликации при анализе пропорций в single‑cell данных и учимся честно ловить биологический шум. Этот туториал посвящен тому, как работает квази‑биномиальная логистическая регрессия — один из наиболее используемых методов в биоинформатике для поиска клеточных популяций, которые растут или исчезают при старении и развитии заболеваний.

Читать далее
1
23 ...