Все потоки
Поиск
Написать публикацию
Обновить
43.99

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга
Уровень сложности

«Золотая лихорадка».БЕЛ: как это начиналось и во что превратилось

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров284

1 октября 2015 года для белорусского интернета открылась новая эра: стартовала открытая регистрация доменов в зоне .БЕЛ. Но путь к этому дню был долгим и напряжённым.

Читать далее

Новости

Анализ гипотез и очень, ооооооочень странные дела

Время на прочтение28 мин
Количество просмотров4.7K

Лет 5 назад я усиленно пытался вникнуть в тервер и статы: книги, статьи, вебсёрфинг. Даже написал несколько статей: раз, два, три. Вообще, в планах было написать довольно большой цикл статей, что бы подсветить какие-то самые сложные вещи, да и самому в них разобраться - совместить полезное с полезным, так сказать. Однако, в какой-то момент я решил, что полученных знаний достаточно для новых проектов и ушел в работу. Работал. Работал. Работал.

Читать далее

Вы встретили разработчика. Ваши действия?

Время на прочтение9 мин
Количество просмотров12K

Как схантить профи, или Гача-игры в найме

Если вам срочно, вот прям щас вдруг потребовались айтишники, то у меня плохие новости. Хорошие спецы неплохо так умеют прятаться. Так что попробуем разобраться, где их искать, чем приманивать и как распознать действительно крутого профессионала.

Читать далее

Как мы начали считать эффективность и подружили дизайн с цифрами

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.6K

Не так давно в моем календаре появилась встреча под названием «Эффективность дизайнеров». И это выглядело как личное оскорбление. Мы всегда работали по спринтам, закрывали задачи, и вопросов к нашей эффективности ни у кого не возникало. До этого дня.

На встрече мне поставили задачу — разработать систему для подсчета производительности каждого дизайнера. Я была уверена, что это невозможно: разный профиль дизайнеров, разный объем проектов.

В каких таких попугаях я должна считать, насколько эффективно отрисовал дизайнер MES-интерфейс или сгенерировал картинки для сайта?!

И в целом, идея засунуть творчество в рамки Excel-таблицы казалась мне абсурдом, который убьет всю магию, превратит вдохновение в сухую отчетность и по итогам моя команда выгорит тотально.

Но я ошибалась. Это было не концом, а началом истории о том, как самая ненавистная и абсурдная идея превратилась в главный инструмент, который понятен бизнесу. Но при этом защищает, а не угнетает команду.

Читать далее

Командная работа без выгорания: как вести IT-команду

Время на прочтение10 мин
Количество просмотров3.7K

Представьте идеальную IT-команду: блестящие специалисты, амбициозный проект, всё для успеха. Но проходит несколько месяцев, и что-то ломается. В чатах исчезают мемы и жаркие споры об архитектуре, остаются лишь сухие «залил пул-реквест». Разработчик, горевший своим делом, теперь молча соглашается с любым решением. Даже успешный релиз не хочется отмечать — будто это не победа, а просто конец очередного марафона.

Это не просто усталость. Это — тихое выгорание. Не громкий скандал, а методичный отказ системы. Не «я устал», а «мне всё равно». И самое тревожное, что менеджмент часто замечает проблему лишь с заявлением об уходе, когда человек мысленно уже месяц как не с нами.

Правда в том, что люди уходят не только из-за денег. Гораздо чаще — из-за ежедневного обесценивания, абсурдного контроля и ощущения бессмысленности. 58% IT-специалистов готовы на меньшую зарплату, но не готовы мириться с токсичной культурой управления (Harvard Business Review).

Эта статья — для тех, кто чувствует, как команда теряет энергию, но не хочет с этим мириться. Для разработчиков, которые видят, как гаснут их коллеги. Для менеджеров, которые хотят вести команду к целям, не сжигая людей. Мы разберем, какие управленческие ошибки убивают мотивацию, и какие практики помогут вернуть команде огонь, устойчивость и желание делать классные продукты.

Читать далее

Дивергенция как мера специфичности аудитории вашей пилотной механики

Время на прочтение11 мин
Количество просмотров567

Хабр, привет! На связи Никита и Егор, мы работаем над продуктовой аналитикой в дирекции по развитию программы лояльности Х5. В статье мы бы хотели рассказать вам о том, как можно использовать модификацию дивергенции Кульбака-Лейблера для ответа на вопрос, а насколько ваша пилотная аудитория специфична относительно генеральной совокупности всех клиентов, и какие могут быть «подводные камни».

Читать далее

Как улучшить оценку МНК в гуманитарных науках

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

Замечательный метод МНК появился в недрах астрономии (точной науки). Здесь мы покажем как можно существенно улучшить ее оценки в гуманитарных (неточных) науках.

Сперва приведем реальный пример его использования. Летом 2024 года я вычислил курс доллара в Казахстане на полгода вперед. И написал об этом статью в здесь же.

Читать далее

Где поток ненужного софта? Почему заявления об ИИ-ассистентах не сходятся

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров26K

Я в бешенстве. Я реально зол. Зол настолько, что хочется сносить чужие песочные замки, зарядить Дэниэлю ЛаРуссо по физиономии и поливать его грязью перед его девушкойa.

Вообще-то я не из тех, кого легко разозлить, но ситуация в индустрии достала окончательно.

Читать далее

IT-рынок в России и СНГ: анализ 85 тысяч вакансий с hh.ru

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров40K

IT-рынок в России и СНГ меняется очень быстро: появляются новые технологии, меняются зарплаты, одни профессии становятся востребованнее, другие — уходят на второй план. Чтобы понять, что происходит прямо сейчас, я решил взять данные напрямую с hh.ru и собрать аналитику в Power BI.

В период с 9 июля по 29 августа 2025 года удалось собрать и проанализировать 85 207 вакансий в сфере IT. В этой статье рассказываю, какие технологии на пике, как меняется спрос на специалистов, какие зарплаты предлагают и где сосредоточено больше всего вакансий.

Читать далее

Throughput: как научиться перестать гадать сроки и начать их предсказывать через симуляцию Monte-Carlo

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5K

Как использовать метрику потока Throughput и реалистично прогнозировать на основе симуляции Монте-Карло. Разберем динамику Throughput (пропускной способности) за значимые периоды времени, насколько она вариативна, посмотрим на кластеризацию по типам работы).

Разбираем метрику через обслуживание в пабе в пятничный вечер в сравнении с АйТи-командой (с паттернами и примерами). Тема довольно актуальная, так как сейчас в США и Европе расцвет прогнозирования на основе именно метрик потока и появляется много плагинов с Монте-Карло (но не все из них доступны в РФ).

Разобраться как точнее прогнозировать

Реализация А/Б-тестов

Время на прочтение22 мин
Количество просмотров681

Для А/Б-тестов в вебе показаны случайный выбор групп, хэширование, логика на бэкэнде и фронтэнде, логирование событий, одновременные эксперименты и админка. Примеры демонстрируют реализацию А/Б-тестов и устройство платформ экспериментов.

Читать

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за август 2025 года

Время на прочтение5 мин
Количество просмотров907

В августе 2025 года информационная служба Хабра выпустила 937 публикаций (903 новости и поста, 15 лонгридов и 18 переводов). В этом дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Комиссии криптобирж в алготрейдинге: подводные камни, сравнение и практические выводы

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2K

Алготрейдинг в криптовалютах уже давно перестал быть уделом крупных фондов — сегодня любой разработчик может написать торгового бота и запустить его через публичное API биржи. Но при этом большинство новичков совершают одну и ту же ошибку — они проектируют стратегию на «чистых» ценах, полностью игнорируя торговые комиссии.

Комиссия — это невидимый враг трейдера. Она напрямую влияет на результативность любой стратегии:

Читать далее

Ближайшие события

Критерий Кендалла W: Почему рейтинги BI друг другу противоречат, и что с этим делать?

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров627

Привет, Хабр! Сегодня я хочу рассказать о применении одного из интересных методов работы со статистическими данными — расчета коэффициента конкордации, который также называют коэффициентом Кендалла W. Он помог нам упростить выбор BI-платформы на замену многострадальному Qlik, который сегодня вообще непонятно как продлевать. Под катом — куча BI-систем, наши попытки усреднить результаты рейтингов…и г-н Кендалл с его методом 100-летней давности.

Читать далее

Что изменилось на рынке труда в IT: исследование на выборке из 128 специалистов

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров19K

Привет, Хабр! Меня зовут Маша Даровская, я шефред издания Тпрогер, веду канал Деврелишна, снимаю подкасты про айти.

В последнее время мне много говорили об изменениях на рынке найма в айти и я решила эту тему исследовать. В этой статье — результаты опроса и ключевые инсайты о зарплатах, поиске работы и текущем настроении айтишников.

Кого опрашивала:
Итак, я опросила 128 человек, из которых 50,4% сеньоры, 41,2% мидлы, остальные 5% и 3,4% — CTO/CEO и джуны соответственно.

Читать далее

Несогласованность эффектов или «Где деньги, Лебовски?»

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.6K

В статье рассматриваются проблемы, возникающие при оценке эффектов A/B-тестов и Causal Inference в ритейле, когда необходимо анализировать изменения выручки по различным категориям товаров и общей (тотал-) категории. Мы подробно рассмотрим, почему простое суммирование оценок эффектов по категориям не всегда дает корректную оценку для тотал-категории, и предложим эффективный способ решения этой проблемы.

Читать далее

Позиционный трейдинг + ML: от нуля до торговой стратегии за год

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров9.3K

В статье рассказывается о создании стратегии для позиционной торговли. Показан опыт разработки инструмента для проверки торговых идей. Описывается реализация стратегии, основанной на принципе «моментума» (когда растущие акции продолжают расти), и её улучшение с помощью оптимизации параметров.

Читать далее

Когда машинное обучение не нужно: статистика для бизнеса

Время на прочтение6 мин
Количество просмотров3.6K

«Есть ложь, наглая ложь и статистика» — этот афоризм, по утверждению Марка Твена, принадлежит премьер‑министру Великобритании Бенджамину Дизраэли. А по мнению скептиков — самому Твену. Как бы там ни было, статистика не так уж и врёт, по крайней мере не больше, чем машинное обучение (ML). Более того — в некоторых случаях она может оказаться привлекательнее, надёжнее и значительно дешевле, чем обучение и внедрение ML‑моделей.

В этой статье я пропущу очевидные вещи вроде среднего, медианы и моды и сразу перейду к более интересным и полезным инструментам. Примеры и код — на Python, с использованием библиотек numpy, pandas.

Читать далее

Мода на медиану

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров12K

У доски стоит менеджер и обосновывает фичу, показывая медианные значения. На задней парте в обнимочку, с попкорном, сидят аналитик с датасайентистом.

Читать далее

Невероятные события: насколько корректен размер выборки?

Время на прочтение6 мин
Количество просмотров1.7K

В недавней статье про Закон больших чисел мы оценивали вероятность больших отклонений с помощью неравенства Чебышёва. Для тысячи бросков монетки оно даёт границу 2,5% для отклонения в 100 и более орлов. Мне стало интересно, насколько это близко к правде.

Я написал симуляцию и проверил — сначала на сотне прогонов, потом на тысяче, потом на ста тысячах. Ни одного такого исхода. Реальная вероятность оказалась меньше 5   10 — катастрофически меньше, чем 2,5% из оценки Чебышёва. Именно это стало поводом для написания статьи.

Мы хотим понять, как связано число испытаний, отклонение и вероятность. Если зафиксировать отклонение, какова вероятность его превышения? Если зафиксировать вероятность, каким должно быть допустимое отклонение? И, наконец, если заданы и вероятность, и отклонение, то сколько испытаний нужно провести, чтобы с заданной вероятностью уложиться в эти рамки?

В этой статье мы начнём с эксперимента и дойдём до строгой экспоненциальной оценки, которая работает для любого числа испытаний. По дороге докажем оценку Чернова и выведем частный случай неравенства Хёффдинга и разберём, как они устроены.

Такие оценки широко используются в прикладной математике. Нам важно заранее знать, сколько испытаний провести, чтобы с частота с заданной точностью приблизилась к истинной вероятности события.

Например, для расчёта необходимого числа наблюдений, достаточных чтобы с заданной вероятностью обнаружить статистически значимое отклонение. Зная допустимую вероятность ошибки и величину эффекта, можно заранее понять, сколько данных нужно собрать, чтобы выводы были обоснованными.

Разница между прогнозами, которые дают неравенство Чебышёва и экспоненциальные оценки, может быть колоссальной!

К неравенству Хёффдинга
1
23 ...