Обновить
111.54

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Хабрахабр: немного статистики и альтернативный топ вопросов и ответов

Время на прочтение3 мин
Количество просмотров2K
Мне так понравилось анализировать хабр(), что я решил проанализировать недавно созданный раздел хабра: вопросы и ответы. Уже сейчас видно, что этот раздел будет таким же веселым, как и остальные.

Итак, я проанализировал 1775 вопросов и получилась такая статистика:
Читать дальше →

Ноль смертей: как выжить в ДТП

Время на прочтение8 мин
Количество просмотров55K

В прошлом году проект “Карта ДТП” опубликовал исходные коды сайта по анализу дорожно-транспортных происшествий. Наша работа получила большой отклик, и мы продолжили развитие. Теперь работает мобильная версия, пропали проблемы с масштабированием, можно поделиться любым сегментом в виде ссылки. Картой пользуются городские активисты, депутаты, архитекторы и транспортные чиновники. Но остается нерешенным вопрос, который мы задавали с самого начала: как добиться минимальной смертности на дорогах?

В 2019 году в ДТП на дорогах и улицах России погибло 16 981 человек

Читать далее

Лавпланет в цифрах

Время на прочтение2 мин
Количество просмотров4.4K
Однажды, что-то накатило и я вспомнил что есть такой сайт знакомств, который лавпланет. Походив по оному, я осознал всю м… ограниченность интерфейса и поиска, а также жажду денег разработчиков. Для оптимизации процессов хождения был набросан бот «на коленке». 

Мне кажется, что ни это, ни сам бот, ни результаты работы оного не очень подходят под тематику хабра (хотя… сам бот может и подойдет), а речь в посте пойдет о цифрах, которые этот пешеход собрал. Цифры будут в виде графиков с небольшими комментариями.

Читать дальше →

Сотрудники со стажем в компании более 2 лет зарабатывают на 50% меньше

Время на прочтение1 мин
Количество просмотров244K
Журнал Forbes обратил внимание на интересную тему, о которой не принято говорить: зависимость зарплаты сотрудника от стажа работы в компании. Выясняется, что на максимальную зарплату могут рассчитывать вовсе не лояльные сотрудники, а совсем наоборот — те, кто часто меняет работу.

У этого явления существует несколько причин. Одна из них — кадровая политика большинства компаний, которая устанавливает потолок на максимальное повышение зарплаты сотрудника. В среднем, в 2013 году зарплаты внутри компаний повышались на 3%. Слабые сотрудники могут рассчитывать на прибавку 1,3%, а самые лучшие — на 4,5%, но не более того. Это примерно соответствует уровню инфляции (2,1% за прошлый год).

В то же время при смене работодателя средняя прибавка к зарплате составляет от 10% до 20%, а иногда и больше.
Читать дальше →

Найм в IT всё-таки мёртв

Время на прочтение3 мин
Количество просмотров76K

Или почему найти работу в 2025 году стало практически невозможно.

Раньше мне казалось, что найти работу — это вопрос желания. Ну правда: обнови резюме, откликнись X раз, получи пару приглашений на собеседования, пройди их — и вот, оффер. Вся проблема решалась увеличением воронки: больше откликов — больше офферов.

Но сейчас всё по-другому

Читать далее

Хабр. «Срез» одного дня

Время на прочтение4 мин
Количество просмотров1.6K
Добрый день, хабравчане!

Под катом небольшая хабрастатистика «возрастных» групп, немного интересных цифр и пара-тройка диаграмм. Срез произведен 13.04.2011, в 22 часа по московскому времени.
Читать дальше →

Что не так? Три парадокса теории вероятностей

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров42K

Парадокс двух детей Вы встретили на прогулке соседей с сыном. Известно, что у них двое детей. Какова вероятность, что второй — тоже мальчик?

Казалось бы, детская задачка, где нужно просто “вспомнить формулу”, но всё не так однозначно. Если задать этот вопрос прохожему, он, скорее всего, скажет ½. Преподаватель математики, возможно, ответит ⅓. Кто из них прав?

В каком-то смысле, правы оба. Просто каждый представляют себе свой способ, как была получена информация о ребёнке. На самом деле это и есть условие задачи. Только скрытое. 

Вопреки распространенному мнению, теория вероятностей не говорит, возможна ли та или иная ситуация. Прежде чем что-то считать, придется подготовить фундамент — идеализировать наблюдение, понять, что именно мы считаем случайным и построить модель эксперимента. Без этого никакие формулы не помогут.

Парадоксы, о которых пойдет речь, — не логические ошибки. Это ситуации, в которых само понятие вероятности начинает колебаться. Они не ломают теорию, но обнажают, где она требует особенной осторожности. Именно в таких местах теория вероятностей становится особенно странной — и особенно интересной.

В этой статье — три таких истории. В первой один и тот же факт даёт разные вероятности, если по-разному устроено наблюдение. Во второй один и тот же объект может быть “случайным” множеством способов. А в третьей невозможно придумать, как сделать задачу математически строгой.

По дороге мы обсудим, что такое вероятностная модель, геометрическая вероятность и математическое ожидание. А в конце поговорим о том, почему в теории вероятностей у одной задачи могут быть несколько ответов и как с этим жить. А еще, вас ждет красивая задача — бонус для тех, кто дочитает статью до конца.

А пока — вернёмся к соседям с мальчиком. Разберемся, почему эта задачка не так проста, как кажется на первый взгляд.

Читать далее

Данные всех стран, не объединяйтесь

Время на прочтение4 мин
Количество просмотров22K
Радует, когда на диаграмме кроме новых созвездий находится нечто похожее на зависимость. В таком случае мы строим модель, которая хорошо объясняет связь между двумя переменными. Но исследователь должен понимать не только, как работать с данными, но и какая история из реального мира за ними лежит. В противном случае легко сделать ошибку. Расскажу о парадоксе Симпсона — одном из самых опасных примеров обманчивых данных, который может перевернуть связь с ног на голову.
Читать дальше →

Хабрахабр: немного статистики и альтернативный топ топиков

Время на прочтение2 мин
Количество просмотров1.4K
Я заметил, что текущий топ хабрахабра содержит малое количество полезных материалов. Вообще, как оценивают материал? Люди ставлят плюс/минус, потому что:
  1. Хотят поощрить автора за написание хороших топиков
  2. Хотят отблагодарить автора за написание сиюминутной новости/интересной картинки
  3. Хотят выплеснуть свое настроение на чужом топике
Вполне очевидно, что такая система голосования не всегда будет поощрять хорошие топики и не всегда в топе будут только хорошие и полезные статьи.
Но у каждой статьи есть еще два иных показателя: количество человек, занесших статью в избранное (коротко — фавориты) и количество комментариев. Очевидно, что первый показатель определяет полезность статьи, а второй — насколько тема затронула умы хабралюдей.
Мне показалось, что альтернативные варианты топа будут очень интересны остальным людям. Вообще, было бы хорошо, если бы такую фичу сделали, разработчики, но…

Итак, я проанализировал 72% топиков хабра (остальные были закрыты/недоступны/удалены) и составил альтернативный топ. Под катом парочка рисунков и ссылки на страницы альтернативного топа.
Читать дальше →

Квартет Анскомбе

Время на прочтение1 мин
Количество просмотров5.9K
Статистика — это такой инструмент… Очень страшный в неумелых руках. В умелых того страшнее, способен разорвать мозг на куски.

Вот есть последовательности A, B, C и D, про которые известно следующее:
  A B C D
Среднее значение x 9.00 9.00 9.00 9.00
Дисперсия х 10.00 10.00 10.00 10.00
Среднее значение y 7.50 7.50 7.50 7.50
Дисперсия y 3.75 3.75 3.75 3.75
Корреляция между x и y 0.82 0.82 0.82 0.82
Прямая линейной регрессии y = 3 + 0.5 x y = 3 + 0.5 x y = 3 + 0.5 x y = 3 + 0.5 x
То есть все указанные величины для них совпадают. По крайней мере, до второго знака после запятой.
А теперь смотрим глазами

Считаем чужие лайки: есть ли на Хабре накрутки?

Время на прочтение13 мин
Количество просмотров8.3K

Как и в любом сообществе, на Хабре есть свои мифы, суеверия и легенды. Один из таких мифов звучит примерно так:
«Сегодня Хабр умирает особенно мощно. Администрация ресурса, ведомая беспрецедентной алчностью, распахнула ворота платформы перед коммерческими компаниями. И теперь солнце над Хабром навсегда заслонили корпоративные аккаунты, в которые пишут лишь посредственные рерайтеры и LLM. Разрозненная и всё уменьшающаяся горстка независимых авторов, помнящих, каким был тот Хабр, не способна ничего противопоставить стихийному бедствию. Ведь любую корпоративную статью через минуту после публикации боты накручивают до +10 рейтинга. И она катапультируется прямиком на первую страницу ленты Лучшее за сутки.»

Если попросить привести какие‑нибудь аргументы в пользу данного тезиса, вам вполне могут сперва сказать:
«Вы что, сами не видите?! По‑моему, это очевидно. Конечно, у меня нет точных данных, так как доступ к API Хабра закрыт и об истинном положении вещей мы можем лишь гадать, но...»
А после волшебного «но» продолжить:
«...но по моим внутренним ощущениям корпоративные рерайтеры пишут уже порядка 70‑80‑90% всех статей Хабра. Вот, например, одна статья, которая мне не понравилась. Разве может быть у статьи, которая мне не нравится такой высокий рейтинг? Не может! Уж поверьте моему опыту, я давно тут варюсь и всё‑всё знаю. А если уж вы хотите объективный критерий, то советую обратить внимание на отношение времени публикации в миллисекундах к количеству закладок. Оно выглядит крайне подозрительно»

У въедливого зануды подобный ответ мог бы породить ещё больше вопросов. Однако не все выражения, которые мы слышим в жизни предназначены для вдумчивого осмысления. Например, странно было бы обсуждать индексы Ласпейреса и Пааше в беседе, начавшейся с фразы «Вот раньше на рубль можно было купить первое, второе и компот, а сейчас...».

Тем не менее. Если вы тот самый въедливый зануда, для которого не «всё и так понятно», то специально для вас я взял карандаш, бумагу, графический программируемый калькулятор Casio fx‑7000G и кое‑что посчитал.

requests.get('https://habr.com/')

Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год

Время на прочтение7 мин
Количество просмотров13K
Привет Хабр.

В первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.



Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.

Продолжение под катом.
Читать дальше →

Ближайшие события

Генератор неслучайных чисел

Время на прочтение4 мин
Количество просмотров21K
Этот код напечатает случайную последовательность латинских букв, так ведь?

import java.util.Random;

class WTF {
    public static void main(String[] args) {
        Random r = new Random(76880392499L<<11);
        String alphabet = " abcdefghijklmnopqrstuvwxyz";
        int n;
        while ((n = r.nextInt(alphabet.length())) > 0)
        	System.out.print(alphabet.charAt(n));
    }
}

Можете проверить; вывод кажется совсем не случайным. Как же так вышло?

Прежде всего: какой шанс, что из всех последовательностей латинских букв напечатается именно эта? Сгенерировано 10 случайных чисел, каждое выбиралось из 27 вариантов, значит всего вариантов было $27^{10} \approx 2.06\cdot10^{14}$. Если считать, что все варианты равновероятны, то нам выпал один шанс из двухсот миллионов миллионов! Ух!
Читать дальше →

Небольшой опрос об операционных системах

Время на прочтение1 мин
Количество просмотров91K
Был уже не один опрос об операционных системах, но все же ситуация меняется. Плюс хочется видеть все в одном флаконе топике. Разговор идет о десктопе.

UPD: анонимным сливальщикам кармы передаю пламенный привет.
20+ процентов Linux радует (хоть сам я пользователь Windows, тихо мечтающий о макбуке).

Статистика по аккаунтам Медведева (Twi, VK, FB)

Время на прочтение4 мин
Количество просмотров7.5K
Хабр, привет!

7 мая с поста президента ушел Д.А. Медведев, которого все мы, возможно, запомним как первого президента России, активно использующего гаджеты, интернет и социальные сети.

Вы может быть слышали, что у Медведева есть аккаунты в Твиттере, ВКонтакте и Фейсбуке. Возможно, вы даже сами подписаны на Медведева в какой-то соц сети. Хотя не уверен.

Недавно, спрашивал у друзей, фолловят ли они Медведева в твиттере? Из 10 человек ответили положительно всего двое. По данным Яндекса в твиттере более 3 млн юзеров. Если аккаунт @medvedevrussia читают более миллиона человек, то получается, что каждый третий пользователь твиттера в России — читает Медведева.

Кто эти люди?!


На этот вопрос я постараюсь ответить ниже. Осторожно, под катом много графиков и текста.
Читать дальше →

Кнопки в автомобиле — это уже роскошь

Уровень сложностиПростой
Время на прочтение26 мин
Количество просмотров22K

В 2021-м году я перевел и опубликовал десятилетнюю статью Будущее интерактивного дизайна в руках. Кроме хороших комментариев, я прочитал ремарку о том, что перевел старую статью и она уже неактуальна. На дворе 2024 год, но она актуальнее ещё больше. Ведь лучше не стало — кнопки нещадно истребляют в автомобилях, заменяя их на «планшеты»

Читать далее

Эксперимент Microsoft по сокращению рабочей недели до 4 дней привёл к повышению продуктивности на 40%

Время на прочтение2 мин
Количество просмотров90K


Япония считается одной из худших стран в плане баланса между трудом и отдыхом. По уровню удовлетворенности людей своей работой, если верить опросам, у неё худшие результаты в мире (6.1 балла). У России, для сравнения, 6.8, в США – 7.7, даже у Китая 7.1. Это огромная и широко известная проблема. От сотрудника ожидают, что он будет трудиться, пока его босс остается в офисе, а совещания часто проводятся уже после окончания рабочего времени. Даже после работы ожидается, что сотрудник пойдет в кафе со своими коллегами, где пройдет небольшая сессия тимбилдинга за пивом или сакэ.


Но даже в Японии некоторые компании идут в другую сторону. Они снижают нагрузку на сотрудников, проверяя, какой это даст результат. Три месяца назад такой тест провела Microsoft Japan, японское подразделение «Майкрософт». В рамках своего проекта Work-Life Choice Challenge 2019 в течение одного месяца в августе компания ввела четырехдневную рабочую неделю для 2300 своих сотрудников. К стандартным выходным добавили пятницу.

Читать дальше →

Цикл жизни хабрастатьи

Время на прочтение1 мин
Количество просмотров1.4K
Немного статистики.
На графике — количество уникальных просмотров хабрастатьи в минуту с момента публикации до конца дня:


Всего просмотров за этот период: 39120
Статистика построена на основе данных лога nginx-a, отдающего прозрачный gif 1x1px, заботливо запиханный в исходную статью вашим покорным слугой =)
Извиняюсь за качество графика — не стал заморачиватся и строил его в excel-е с последующей оцифровкой через Paint…
Время на графике — GMT +3 (МСК)

Что вы читали и комментировали в этом году

Время на прочтение10 мин
Количество просмотров15K

Привет! До Нового года еще полторы недели, но мы решили подвести небольшие итоги уже сегодня. Во-первых, вряд ли в саму новогоднюю ночь вы будете читать подобный пост. Во-вторых, ещё менее вероятно, что 30 декабря мы бы осилили выгрузить статистику, чтобы 31-го написать пост. Так что — держите.

Самые читаемые посты за год

Disclaimer. Мы не стали включать в топ самых читаемых постов материалы от нашей редакции и из корпоративных блогов.

PS Но отдельная статистика по корпоративным блогам и редакции тоже есть в посте.

Читать далее