Обновить
105.08

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

«Парадокс инспекции» встречается повсюду

Время на прочтение3 мин
Количество просмотров47K
Многим известен так называемый «парадокс дружбы» (friendship paradox) в социальных сетях, впервые упомянутый в научной работе 1991 года, когда социальные сети были только в офлайне. Этот парадокс применим и к современным социальным сетям в интернете.

Если взять любого пользователя Facebook и случайным образом выбрать любого из его друзей, то с вероятностью 80% у друга будет больше «френдов». Люди, которые плохо знакомы с математической статистикой, очень огорчает тот факт, что почти все френды более «успешны» в общении, чем они сами. Но здесь нет причины для депрессии: так и должно быть, в соответствии с наукой и здравым смыслом.

Парадокс дружбы — одна из форм «парадокса инспекции» (Inspection Paradox), который встречается буквально повсюду и частенько вводит в заблуждение обывателей.
Читать дальше →

Галлий, германий, а теперь и графит: Китай понемногу ограничивает экспорт ценных ресурсов. Зачем это КНР?

Время на прочтение4 мин
Количество просмотров15K

В конце лета Китай практически остановил экспорт таких необходимых для различных отраслей металлов, как галлий и германий. Они не являются очень уж редкими, месторождения металлов есть и в других странах. Но КНР за прошедшие пару десятилетий смогла замкнуть на себе логистику. Соответственно, теперь покупателям галлия и германия приходится перестраивать цепочки поставок, а это процесс небыстрый.

Теперь же Китай пошел на новые ограничительные меры — страна ограничивает экспорт графита. По словам представителей КНР, поставки не останавливаются, просто экспортерам необходима специальная лицензия. Но то же самое говорилось и в отношении галлия с германием. А лицензии не получил в итоге почти никто. Подробности — под катом.
Читать дальше →

Когда начинает работать закон больших чисел

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров19K

Большие числа != большим числам.

Число 100 большое? Зависит от ситуации. Сравниваем ли мы его с 0,001, или с 100000? Как и многое в жизни, понятие «большой» относительно.

В этом посте мы объясним, насколько большим должно быть «большое» и докажем, что вы, скорее всего, ошибаетесь насчёт закона больших чисел.

Читать далее

Проверяем ветхозаветную историю происхождения человечества от Адама и Евы с помощью популяционной модели

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров15K

Помню, как несколько лет назад сидел на последнем ряду аудитории и слушал лекцию по теории эволюции. Тогда мне это было особенно интересно: каждый вечер я штудировал доклады Дробышевского, Соколова, Панчина, Гельфанда и других причастных к Антропогенезу. И в один день преподаватель сердито посмотрела в окно и спросила меня, как долго должны ходить по газону люди, чтобы образовалась тропа.

На этот странный вопрос я ответить не смог, но он меня неожиданно натолкнул на идею для любопытного эксперимента. Зачем изучать тропообразовательный потенциал людей, когда можно построить симуляцию и проверить теологическую теорию о самом происхождении человечества. Мне стало интересно, может ли человечество развиться до 11 млрд со времен Адама и Евы к концу XXI века. О том, что из этого получилось, рассказываю под катом.
Читать дальше →

Цены на редкоземельные металлы, дефицит чипов и торговые войны: стоимость гаджетов будет только расти

Время на прочтение4 мин
Количество просмотров22K

В начале этого года мы писали о том, что Китай планирует начать ресурсную войну в отношении США. Это должно было стать ответом КНР на санкции Соединенных штатов. Пока что открытой и активной войны нет, хотя предпосылки были, но, возможно, ресурсная война и не потребуется. Дело в том, что за последние несколько месяцев резко повысились цены на редкоземельные металлы.

Стоимость ресурсов — крайне мощный ценовой фактор для всей индустрии производства электронных компонентов и гаджетов. Их стоимость и так постепенно увеличивается, а сейчас игроки рынка ожидают уже не плавного, а скачкообразного роста цен буквально на все.
Читать дальше →

Сайт знакомств подкручивал совместимость профилей, чтобы стимулировать активность — и ещё два эксперимента над пользователями

Время на прочтение2 мин
Количество просмотров69K
Когда в твоём распоряжении миллионы пользователей — видимо, не так просто удержаться от соблазна поэкспериментировать над ними. Уже «Фейсбук» извинился за то, что управлял настроением своих пользователей, формируя новостную ленту. Следом за ними расчехлился крупный сайт знакомств OkCupid, в блоге которого вчера появилось описание трёх социальных экспериментов, которые ставились над его пользователями.


Читать дальше →

Ты мог бы стать спортсменом, если бы родился в другой день. Что такое Relative Age Effect?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров19K

Что делает перспективного ребенка из местной спортивной секции чемпионом мира по футболу, олимпийским призером или обладателем Кубка Стэнли?

Талант? Упорный труд? Но что если есть и другая причина, о которой мы раньше не слышали. Или не хотели слышать. Что, если она не так мелодична, не так романтична и уж совсем не вписывается в наше представление об истинном успехе?

Читать далее

2019 год на Хабре в цифрах: постов больше, минусуют так же, комментируют активнее

Время на прочтение3 мин
Количество просмотров10K

Команда Хабра почти в полном составе

Мы можем только догадываться, как всё выглядело снаружи, но изнутри Хабра 2019-й показался чертовски насыщенным. Мы по чуть-чуть меняли подход то тут, то там, и все вместе эти мелочи сделали проект более открытым и дружелюбным. Мы «раскрутили гайки» — теперь на Хабр можно репостить из личных блогов, а за посты голосовать дольше; новых авторов встречает специальная страница, заряженная на успех; мы постоянно улучшаем мобильную версию и потихоньку готовимся к релизу PWA. В начале года мы запустили англоязычную версию, и 12 месяцев спустя на нее заходят уже 400 тысяч человек ежемесячно. А в конце года мы сделали ребрендинг и теперь наши проекты-сателлиты по-настоящему стали частью Хабра и доступны по говорящим адресам career.habr.com, freelance.habr.com и qna.habr.com. Заодно в декабре немного видоизменили и навигацию, подчеркнув, что тут есть не только потоки о разработке и администрировании, но и сравнимый по масштабу раздел с научно-популярными статьями, а еще потоки о дизайне, менеджменте и маркетинге. Но что бы мы там ни меняли, главное осталось на месте — во главе угла стоит контент, которые создают участники сообщества. Об этом сейчас расскажем подробнее.
Читать дальше →

Наиболее востребованные языки программирования – 2018

Время на прочтение3 мин
Количество просмотров200K
Очередная статистика от hh.ru под катом. Вкратце — очень хотелось посчитать, на каких языках чаще всего пишут отечественные разработчики и какие языки чаще других ищут работодатели. Итого — посчитал, что указывали в вакансиях и в резюме в первом полугодии 2018 и 2017 годов. Получилось что получилось.


Читать дальше →

Основные типы распределений вероятностей в примерах

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров59K

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением. Любые изменения в пользовательском опыте на сайте компании (внешний вид, структура, контент) приводят к изменениям в работе пользователя и, как результат, изменения наблюдаются в собираемых данных. Важным элементом анализа изменений данных и его фундаментом является использование основных типов распределений случайных величин, от понимания которых напрямую зависит качество оценки значимости наблюдаемого изменения. Рассмотрим их подробнее на наглядных примерах.

Читать далее

Два по сто: самые читаемые статьи и авторы Хабра и ГТ

Время на прочтение10 мин
Количество просмотров67K
Если кто не знает, на Хабре, как и Гиктаймсе, всегда можно посмотреть все самые рейтинговые статьи за всё время. Но по просмотрам ни статьи, ни авторы никак не сортируются. Список ниже отражает почти полную правду о самых читаемых статьях «Хабра» и «Гиктаймса» за всё время. Почти — потому что, к сожалению, публичный счётчик был включён только 27 сентября 2012 года (примерная дата), поэтому если вам кажется, что какие-то ваши любимые тексты эпохи, когда Хабр был более торт, недосчитались просмотров — может, вы и правы. Впрочем, отчасти фактор неработавшего ранее счётчика нивелируется мощным хвостом в виде поискового траффика, так что действительно сильные тексты в любом случае должны были получить то, что им причитается — но об этом позже.

Итак, самые топ-100 самых читаемых постов за всё время на Хабре и ГТ в сумме. Megamozg included by default, т.к. данные собраны 21 мая, уже после обратного слияния с «Хабром»:

  1. «Скрытые смайлы в Skype», G0rDi — 1599K (2009)
  2. «Взломать Wi-Fi за… 3 секунды», ushanov90 — 1511K (2012)
  3. «Взломать Wi-Fi за 10 часов», gorl — 1181K (2012)
  4. «300 потрясающих бесплатных сервисов», shimapa23 — 1052K (2015)
  5. «Пишем своё первое приложение на Android», Hoorsh — 997K (2010)
  6. «Обновление с Windows 7/8.1 до Windows 10 TP через Windows Update», akibkalo — 840K (2015)
  7. «Простая стратегия игры 2048», WhatIsGTO — 820K (2014)
  8. «Откровенные фото Дженнифер Лоуренс и еще десятков знаменитостей утекли через iCloud», Akr0n — 795K (2014)
  9. «Подарок от Skype на новый год», gmikhail94 — 781K (2013)
  10. «Wi-Fi: неочевидные нюансы (на примере домашней сети)», apcsb — 757K (2012)

Читать дальше →

Linux на распутье: взлет в США и Германии, спад в Индии

Время на прочтение5 мин
Количество просмотров14K

В июне 2025 года доля Linux на мировом рынке настольных ОС составила 4,1%, согласно данным StatCounter. Это небольшой откат от прошлогоднего пика в 4,5% в августе 2024-го. Казалось бы, мелочь, но за этим спадом стоит громкая история: Индия, страна с населением 1,4 миллиарда, буквально бежит от Linux. За год доля этой ОС в стране рухнула с 17,25% до 8,77% — почти вдвое. Что пошло не так? Давайте разберёмся, почему пингвин теряет позиции в одной из самых густонаселённых стран мира, в то время как в США и Германии он празднует успехи, перешагнув 5% рубеж.

Читать далее

Исследование: Миграция IT-специалистов в 2022-2023 гг

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров14K

Всем привет. Меня зовут Алёна, я выпускница магистерской программы "Социология публичной сферы и цифровая аналитика" НИУ ВШЭ. В апреле 2024 г. в рамках работы над своей выпускной работой я провела количественное исследование на тему миграции в IT-сфере - кто, куда уезжал за прошедшие два года, почему и всё в этом духе. Здесь хочу поделиться его результатами. Надеюсь, будет интересно!

Если вам есть, что сказать по поводу прочитанного, оставляйте комментарии. Буду очень рада обсудить, ответить на вопросы или получить обратную связь :)

Читать далее

Ближайшие события

День числа Пи

Время на прочтение1 мин
Количество просмотров3.7K
Cегодня (3.14.2008, если не по нашему писать) день числа πи, с чем я вас и поздравляю. Всем желаю сегодня выпить пива с пирогами. А в 1:59 все математики уже вздрогнули.

А еще, сегодня у Альберта Эйнштейна день рождения.

Хабр не понял мнемонику π :(


стишок!

Шесть причин, почему ваши A/B-тесты не работают

Время на прочтение18 мин
Количество просмотров46K

Всем привет! 

В прошлой статье, посвящённой A/B-тестированию, мы коснулись технических деталей устройства нашей A/B-платформы, которая обеспечивает нам супербыстрое распределение пользователей по вариантам. Теперь пришло время поговорить о методологии и процессе A/B-тестирования, а если точнее, то о проблемах и заблуждениях, которые могут привести к тому, что, проснувшись однажды среди ночи, вы почувствуете нестерпимую боль ниже спины от внезапного осознания очень простого факта —все проведённые вами A/B-тесты невалидны. 

Это не пустые слова, результат многомесячного труда кучи людей может обесцениться в один момент, например, из-за неправильной агрегации данных или неправильной оценки статистической значимости равенства средних для ratio-метрики. Что уж говорить о более сложных проблемах, таких как множественное тестирование и ранняя остановка ваших тестов. 

У A/B-тестов есть хорошее свойство — они либо работают, либо нет. Сегодня вы узнаете, что нужно учесть, чтобы заставить ваши эксперименты работать и приносить тем самым пользу бизнесу. Мы рассмотрим шесть самых распространённых причин, ведущих к несостоятельности системы принятия решений с помощью A/B-тестирования. 

Читать далее

Доллары в глазах: сравниваем российские и американские зарплаты

Время на прочтение7 мин
Количество просмотров116K

Задумываясь о релокации, в первую очередь оцениваешь свой текущий уровень дохода и потенциальные карьерные перспективы в новой стране. Вопрос сопоставления зарплат двух стран — сложный и комплексный. Поэтому в этом материале мы не просто собрали данные, но и подробно расписали нюансы, которые нужно учесть для правильных выводов.

Данный материал будет полезен разработчикам, Product Manager-ам, аналитикам, тестировщикам, Data Scientist-ам, HR-ам, опытным специалистам уровня middle+, а также всем-всем-всем мечтающим релоцироваться в США.

Читать далее

«Рост зарплат в IT это плохо? Вы же шутите, да?»

Время на прочтение16 мин
Количество просмотров86K

Недавно мы выпустили статью «Дефицит в IT: платите больше» о росте зарплат. Совпадение или нет, но чуть позже вышла статья о минусах большого заработка у российских айтишников. Автор рассуждал о том, как высокие зарплаты могут навредить IT-отрасли. На первый взгляд аргументы выглядят логично. Но это только на первый взгляд.

Читать далее

Хабрастатистика: анализируем комментарии читателей

Время на прочтение4 мин
Количество просмотров10K
Привет Хабр. В предыдущей части была проанализирована популярность различных разделов сайта, и параллельно возник вопрос — какие данные можно извлечь из комментариев к статьям. Также хотелось проверить одну гипотезу, о которой скажу ниже.


Данные получились довольно интересные, также удалось составить небольшой «мини-рейтинг» комментаторов. Продолжение под катом.
Читать дальше →