Обновить
108.66

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Дефицит есть, а денег не дают. Почему?

Время на прочтение27 мин
Количество просмотров302K

Мы уже выяснили, что у нас есть дефицит рабочих рук во всех отраслях. На примере СССР увидели, что дефицит легко закрывается деньгами и плюшками, что сейчас и происходит в IT. Однако при дефиците рабочих рук в остальных отраслях зарплаты остаются на уровне Румынии и никак не подтягиваются. Почему?

Читать далее

Новости

Дефицит специалистов не только в IT — он везде. Но денег не платят

Время на прочтение17 мин
Количество просмотров200K

Когда мы писали про рост зарплат в IT, то выяснили, что они растут из-за дефицита специалистов и выравнивания значений по уровню западных зарплат. Но оказывается, что дефицит есть везде. Абсолютно везде. Не хватает учителей, врачей, строителей, металлургов, водителей, инженеров и даже курьеров. На рынке повальный дефицит специалистов, которым предлагают зарплаты на уровне Молдавии или Республики Косово.

Читать далее

Хабр умирает, и это не кликбейт

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров79K

Блуждая по Хабру, я всё чаще слышу один и тот же рефрен: «Хабр уже не тот». Статьи не набирают, интерес аудитории угас, а в кулуарах DevRel'ы жалуются, что «продвигаться стало невозможно». Но так ли это на самом деле? Или это классическая «раньше трава была зеленее»?

Читать далее

А знаете ли вы, что…

Время на прочтение5 мин
Количество просмотров5.4K
— существуют хабрапользователи в чьи Хабрацентры невозможно попасть
— самым «дружелюбным» на хабре является KAFLAN
— самым «успешными» новичками являются PapaBubaDiop и Sterhel
— среди хабропользователей популярно имя Робот

и многое другое...

Дефицита нет, платить не нужно

Время на прочтение14 мин
Количество просмотров96K

Написать данную статью меня побудил цикл статей о дефиците кадров, который, в большинстве своем, представляет собой компиляцию постов в телеграм-каналах Пряникова и Девола.

 В статьях описано много фактов, однако, выводы, да и сам тезис, несколько противоречивые, о чем некоторые не преминули написать в комментариях.

Я берусь доказать, что основной тезис ошибочен. В РФ нет дефицита кадров. 

Читать далее

Статистика Хабрахабра

Время на прочтение4 мин
Количество просмотров186K
Почти неделя прошла с исполнения хабрахабру 6 лет. Было бы очень интересно посмотреть на графики роста показателей сайта. Т.к. стандартная статистика малоинформативная, решено было собрать всю информацию своими руками и проанализировать. И так, почти неделя парсинга и сбора информации и получены следующие интересные данные(скрытые/удаленные посты/пользователи и их комментарии не учтены):
  • Больше всего постов написал alizar — 4298, рекорд 12 постов в день поставлен 18 октября 2006
  • Больше всего комментариев написал VolCh — 19323, установив личный рекорд 27 июля 2011 года в количестве 140 комментариев.
  • Больше всех опубликовал постов в день freetonik —21 топик 26 августа 2007
  • Максимальная активность хабры в день — опубликовано 105 топиков: 18 февраля 2010 и 22 июня 2008 года.
  • Максимальная активность хабры в месяц — опубликовано 2055 топиков в марте 2010
  • Среднее значение кармы: +7,83
  • Средний рейтинг топика: +24,75
  • Всего комментариев: 3 703 022.
  • Средний рейтинг комментария: +0,98
  • Максимальное количество оставленных комментариев — 1 июля 2011 в количестве 4936 штук.
  • 25% из всех опубликованных топиков были перенесены в черновики
  • Самый комментируемый топик habrahabr.ru/post/123157 собрал 2252 комментария

Красивые графики, методы измерения, база с полученными данными, «хаброаномалии» — все это под катом.
Читать дальше →

Данные выборов получили, теперь деобфусцируем и очищаем

Время на прочтение5 мин
Количество просмотров49K

В 2021 году Центризбирком РФ обфусцировал статистические данные выборов на своем сайте. Несколько дней назад я сделал и выложил в комментариях к новости на хабре деобфускатор, чтобы помочь исследователям обнаружить статистические аномалии в результатах. Сегодня взял день отпуска, написать этот пост и поделиться очищенными данными в формате sqlite по федеральному избирательному округу, которыми поделился @illusionofchaos в посте Получаем данные результатов выборов с сайта Центризбиркома РФ

Под катом я предлагаю еще раз посмотреть, какими техническими методами затрудняли анализ программисты сайта ЦИК-а. Новых идей там нет, решения примитивные , даже обидно что кто-то за них квартиру получил[*]. Вся работа по написанию деобфускатора заняла меньше рабочего дня (точнее вечера + полночи). Основная цель этой статьи не в описании методов, а дополнительный анонс деобфускатора для исследователей. Обсуждать решение применить методики запутывания на государственном сайте куда интереснее, но этим бессмысленно заниматься в интернете.

Итак, они реализовали четыре метода:

Читать далее

Что не так с экспериментом Microsoft про 4-х дневную неделю или не теряем голову при виде 40% эффективности

Время на прочтение3 мин
Количество просмотров80K
Последние дней 10 по миру регулярно пишут про эксперимент по переходу на 4-х дневную рабочую неделю и эффектов в 40% от такого решения. Хабр не исключение, и аналогичный пост набрал 93 плюса и 71,4 тысячи просмотров и 338 комментариев. Т.е. результат более чем приличный.

Меня же эти цифры зацепили и я долго думал над тем, что с ними не так. Заручившись помощью Ильи Пестова и его канала Groks, я наконец сформулировал, почему изначальный пост — это скорее насилие пиарщиков над здравым смыслом, чем реальные цифры. И в данном тексте я попробую это описать, потому как говорил еще Марк Твен: «Существует три вида лжи: ложь, наглая ложь и статистика».


Читать дальше →

Почему все «прутся» в IT

Время на прочтение17 мин
Количество просмотров145K

Люди уходят в IT отовсюду: из инженеров КИПиА, электротехников, начальников службы охраны, химиков, бухгалтеров, экономистов, металлургов, юристов, медбратьев, руководителей отдела рекламы. Люди уходят в IT в любом возрасте: в 20, 30, 40 лет и даже после 50. 

Зачем? Почему? Что им на месте не сидится? Почему все «прутся» в это IT? Есть несколько факторов, которые этому поспособствовали. Некоторые из них мы рассмотрим. Они на самые глобальные, но важные.

Читать далее

На фондовом рынке США сформировался пузырь небывалых размеров

Время на прочтение13 мин
Количество просмотров164K

Оценки напрочь оторвались от фундаментального анализа, мультипликаторы находятся на исторических максимумах, скорость эмиссии ценных бумаг зашкаливает — и всё это сопровождается безумно спекулятивным поведением инвесторов. Большой кризис неизбежен.

Читать далее

О талантах, деньгах и алгоритмах сжатия данных

Время на прочтение16 мин
Количество просмотров47K


Алгоритмы сжатия — это очень коварная тема, привлекающая многих новичков. Это правда! Часто человеку кажется, что его осенила божественная идея, как сильно сжать данные. Любые, кстати! Без потерь! Рекурсивно! А поскольку данные — это хранение информации и передача, то если хотя бы на единицы процентов результат улучшить — это миллиарды долларов (смотрим экономию всех провайдеров на передаче и хранении, всех дата-центров компаний, всех домашних пользователей, перемножаем… аж дух захватывает)! И люди пишут письма:
«Обращаюсь к вам, как «создателю и демиургу проекта ;) compression». Мной придуман алгоритм, основанный на простом рассуждении – если файл условно несжимаемый, есть вероятность что, часть файла имеет избыточность и файл можно сжать частично. …» 
«Обращаюсь к Вам, как к одному из главных специалистов в области сжатия информации. Предлагаю Вам ознакомиться с изобретением в области сжатия информации. [...] По мнению автора, основным достоинством данного «Способа кодирования информации» является способность одинаково хорошо сжимать без потери качества информацию любого типа (видео, аудио, текст, архив и т.д.). Помимо этого «Способ» позволяет проводить процесс кодирования (сжатия) повторно....» 

Бывает даже так:
«Мне, для начала, нужно 30–60 минут общения с Вами по Скайпу.
Вопрос: каково Ваше вознаграждение и куда его отправить?» 

И если вы думаете, что обращения типа последнего — мои любимые, то реакция ровно обратная («Боже, дай мне терпения!»). Ибо по опыту в последнем случае люди наиболее настойчивые… Кстати, это могут быть не только авторы, но и инвесторы, о которых ниже тоже будет. 

Кому интересно, в чем же таки коварство алгоритмов, есть ли у нас таланты, и где же, наконец, деньги — добро пожаловать под кат! (Талантливые авторы алгоритмов могут сразу переходить в раздел «Про деньги»).
Читать дальше →

Что же не так с любыми электронными голосованиями?

Время на прочтение7 мин
Количество просмотров45K

Данная публикация написана по мотивам поста «Что же не так с ДЭГ в Москве?». Его автор описывает, как можно выгрузить и расшифровать данные по электронному голосованию, а также приводит целый список замечаний к его текущей системе.

Статья хорошая, её выводы и замечания я полностью поддерживаю, но мне захотелось дополнить её в обеих частях. Первая — с анализом того, как в процессе голосования менялись отданные за различных кандидатов голоса (и обнаруженные в этом аномалии); вторая — моя позиция о фундаментальных недостатках любого электронного голосования, которые неустранимы на практике (особенно в современной России).

UPD: Добавил также графики по партийным спискам + отметил некоторые странности в соотношении выданных/полученных транзакций в самом начале (возможно, это объяснимо техническими проблемами).

Читать далее

О Хабрахабре, статистике и тортах

Время на прочтение3 мин
Количество просмотров2.2K

Лирическое отступление


Здравствуйте!
Однажды темным зимним вечером мне было нечего делать и я убивал время чтением любимого Хабрахабра. В коментах в очередной раз проскочила фраза о том, что Хабр, дескать, уже не торт.

Статистика, статистика и еще раз статистика


Мне стало интересно, можно ли как-нибуть оценить качество статей на Хабре численно и будет ли видно по полученной оценке, как оно менялось со временем, или же, на самом деле, все эти комментарии не более чем брюзжание о том, что раньше и трава была зеленее? Дело было вечером и делать было нечего, поэтому я взял волю в кулак и написал простенького бота, который неспеша перекопал почти 2800 страниц главной Хабра и собрал статистику по захабренным статьям с момента открытия Хабра и по 31 декабря 2009 года.
Традиционная картинка для привлечения внимания, график количества статей по месяцам:

под катом еще много интересного

Ближайшие события

Опросил больше 1000 айтишников: вранье в резюме и котируемость курсов по «вкатыванию в IT»

Время на прочтение7 мин
Количество просмотров136K

Получилось отследить довольно интересные тренды: как размер стажа в индустрии коррелирует с отношением к выдумыванию опыта в резюме, как в IT-среде на самом деле относятся к выпускникам школ в стиле «стань айтишником за год», а также рейтинг самых ненавидимых и респектуемых в среде профи школ.

Читать далее

Аудитория Хабрхабра

Время на прочтение4 мин
Количество просмотров3.9K
habrВ русской поговорке говорится «С кем поведешься — от того и наберешься». 

А чего можно набраться, обитая на Хабре? Для этого надо понять, с кем же можно повестись на Хабре, то есть кто посещает этот проект. 

Чтобы ответить на этот вопрос, я чуть более недели назад попросил пользователей принять участие в анкетировании, которое бы дополнило данные о сообществе Хабрахабра, которые уже есть в медиа ките и статистике. На эту просьбу откликнулось более 2 800 человек! 

С результатами этого анкетирования я хотел бы познакомить вас в этом топике. Ниже будет рассказано о том, кто же они — пользователи и читатели Хабрахабра, чем они занимаются, что любят, о чем думают, а также будут даны три практических совета, плюс бонус!
Читать дальше →

Хабр — Итоги 2024 года

Время на прочтение9 мин
Количество просмотров15K

Среди всей суеты в этому году было то, что остаётся неизменным поводом для веры в человечество. Это наука: Илон Маск впервые имплантировал микрочип Neuralink человеку, на спутнике Сатурна Мимасе открыли океан из воды, создан препарат для лечения страшной болезни Бехтерева, на основе мРНК разработана вакцина от меланомы (одного из самых распространённых видов рака), созданные вирионы уничтожили бактерию изнутри, установлен новый рекорд в беспроводной передаче данных (938 гигабит в секунду), препарат Ленакапавир против ВИЧ был проверен и оказался эффективен в 99% случаев. И это лишь малая часть…

Второе, что внушает веру в человечество, это чтение. В век коротких роликов, картинок и инфографики на Хабре продолжают писать и читать лонгриды, экспертно их комментировать, писать ответы, устраивать горячие дискуссии. При этом шардирование баз данных может увлечь так же сильно, как обсуждение чего-то научно-популярного.

Как всегда, Хабр был разным, оставался зеркалом IT-сферы и всего вокруг неё происходящего, реагировал, бурлил, обсуждал. Жил свою уже совершеннолетнюю жизнь. Оглянемся на 2024 год?

Читать далее

Хабр — Итоги 2023 года

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров21K

Итак, 2023 год. Обнаружена планета с высокой вероятностью существования жизни, на 3D‑принтере учатся печатать сердце, сделаны шаги в борьбе с раком и деменцией, одобрили первое лекарство от болезни Альцгеймера и разработали препарат от болезни Бехтерева, пересадили глаз целиком, запустили GPT-4 и целую кучу нейронок — и это только малая часть итогов года. 2023, как и все остальные, дал нам много нового в науке, карьере, что‑то изменил у каждого в жизни. Менялся и Хабр: где‑то заметно, где‑то не очень, на уровне логики, чтобы каждому пользователю стало чуть быстрее и чуть приятнее. Традиционно в конце года мы всех посчитали и делимся самым важным с самыми важными — с пользователями, читателями и гостями Хабра.

Читать далее

Где поток ненужного софта? Почему заявления об ИИ-ассистентах не сходятся

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров28K

Я в бешенстве. Я реально зол. Зол настолько, что хочется сносить чужие песочные замки, зарядить Дэниэлю ЛаРуссо по физиономии и поливать его грязью перед его девушкойa.

Вообще-то я не из тех, кого легко разозлить, но ситуация в индустрии достала окончательно.

Читать далее

Статистика публикаций на Хабре

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров8.6K

Всем привет! Прочитав заголовок, вы наверняка подумали, что речь пойдёт о какой-то сводной статистике по публикациям за тот или иной период, разные срезы и так далее — чтобы удовлетворить любопытство и сделать какие-нибудь выводы. Но нет: сегодня речь пойдёт о новой фиче для авторов — статистике публикаций — которая, мы надеемся, поможет сделать ваши статьи на Хабре ещё круче!

Читать далее

Фирменные цвета сайтов и компаний

Время на прочтение1 мин
Количество просмотров8.9K
image

Время от времени у меня возникает ощущение, что крупные сайты тяготеют к синим оттенкам в оформлении и логотипах. Решил, что праздники — хороший повод убить немного времени и разобраться, реальность ли это или всего лишь «фейсбук-эффект».
Немного бесполезной статистики под катом
1
23 ...