Статистика в IT

Статистика, исследования, тенденции

СтатьиПостыНовостиАвторыКомпании

denis-19

12 авг в 16:356.4K

Управление проектами * Управление продуктом * Статистика в ITФинансы в IT

Представлен Топ-50 самых дорогих частных компаний мира - 31 из США, 10 из Китая. Источник: Visual Capitalist.

TD-TD

3 июл в 15:306.6K

Математика * Статистика в ITСоциальные сети

Случайна ли случайность? Теория вероятности и личный опыт

Все мы когда-то слышали или читали, что кто-то где-то выиграл джекпот. Столько-то миллионов рублей или долларов, не имеет значения. Важно то, что этого никогда не случится с нами, потому что вероятность этого события – 1 на сотни миллионов.

Однако, со мной кое-что случилось, что, мне кажется, в соответствие с теорией вероятности случится не должно было никогда. И этим оно напоминает джекпот.

На старших курсах ВУЗа проходил практику в школе своего города, который расположен ровно в 1 000 км от Москвы. Преподавал естественные дисциплины школьникам 5-9-х классов. Не суть, что там было по учёбе, главное, что в одном из 9-х классов учился юноша, который в следующем учебном году, т.е., уже осенью, должен был уехать с родителями в Москву. Юноша упомянул как-то про это, и мы даже разговорились с ним, потому что я сам через несколько месяцев собирался уехать в Москву на стажировку. Для нас обоих это был совершенно новый, неизведанный мир. Одно слово - столица!

Наступила осень. Приехала в гости к молодому стажёру мама и я повёл её в театр. И вот садимся мы на свои места, а рядом, на соседнем месте оказывается… тот самый юноша, уже московский десятиклассник, с которым мы полгода назад болтали непринуждённо про столицу нашей Родины.

В пекло теорию вероятности! В соответствии с ней описанное выше событие не могло произойти со мною в принципе. А оно было. И это реальный факт, который до сих пор помню.

Вот так я выиграл свой «джекпот», за несколько сотен рублей, которые стоил билет в театр в далёком 1992-м году. Правда, выигрыш в том «джекпоте» достался мне небольшой, точнее сказать, ничего не досталось, кроме улыбки и взаимного удивления невероятному стечению обстоятельств. Но, надеюсь, что для одного небольшого поста на Хабр этого хватит.

И, конечно, было бы интересно оценить вероятность описанного выше события, однако, я затрудняюсь даже с направлением, с какой стороны следует подступаться к такой оценке, не то, чтобы какими-то цифрами оперировать.

Тут, думаю, нужны кругозор и хватка многоопытного актуария или серьёзного аналитика, для которого подобные задачки – как семечки щёлкать. Есть ли такие на просторах Хабр?

denis-19

2 июл в 08:336K

Статистика в ITНаучно-популярноеБудущее здесь

2050 год стал ближе, чем 2000. 1 июля 2025 года — примерная середина между 1 января 2000 и 1 января 2050. А сегодня, 2 июля, мы официально перешли на ту сторону: будущее ближе, чем прошлое.

denis-19

14 июн в 19:0310K

Управление продажами * Управление персоналом * Статистика в ITФинансы в IT

Сколько часов в неделю нужно работать в разных странах мира в 2024 году, чтобы перестать соответствовать бедному уровню доходов.

denis-19

1 июн в 14:2911K

Статистика в ITНаучно-популярноеЗдоровьеБудущее здесь

Продолжительность жизни в разных странах мира в 2025 году. В России - 74 года.

denis-19

30 мая в 10:465.4K

Статистика в ITИскусственный интеллектЗдоровьеБудущее здесь

В докладе Белого дома, посвящённом снижению продолжительности жизни в США, обнаружены десятки фиктивных и ошибочных научных ссылок, предположительно сгенерированных искусственным интеллектом. Некоторые исследования оказались вымышленными, а ссылки — нерабочими или приписанными несуществующим авторам. Эксперты назвали документ ненадёжным, а Американская ассоциация общественного здравоохранения призвала полностью отказаться от его использования.

denis-19

29 мая в 06:005.1K

Криптография * Анализ и проектирование систем * Математика * Статистика в IT

АНБ США рассекретила внутреннее исследование 1988 года под названием: «Пятьдесят лет математического криптоанализа (1937-1987)».

denis-19

24 мая в 08:044.7K

Мессенджеры * Статистика в ITСмартфоны

Основатель мессенджера Павел Дуров сообщил, что Telegram поднялся на восьмое место в рейтинге самых скачиваемых приложений в первом квартале 2025 года.

denis-19

23 мая в 06:025.7K

Учебный процесс в ITКарьера в IT-индустрииСтатистика в IT

Средний IQ в России в 2024 году вырос на 2.69 пункта и достиг 103,16.

denis-19

22 мая в 10:485.2K

Математика * Статистика в ITНаучно-популярное

Авторы YouTube-канала Linus Tech Tips установили новый рекорд, посчитав число π до 300 триллионов знаков после запятой. Они использовали мощные серверы и 1,5 петабайта памяти. На вычисления ушли 191 сутки. 300-триллионным знаком стала цифра 5.

Ранее команда StorageReview Lab посчитала число π до 202 триллионов знаков после запятой (там была цифра 2). Предыдущий рекорд принадлежит той же команде и составляет 105 триллионов знаков.

denis-19

20 мая в 07:044.8K

Open source * Git * GitHub * Управление разработкой * Статистика в IT

В репозитории Tencent Cloud SDK for Go на GitHub содержится более 200 000 тегов Git. Это так много, что попытка взаимодействия с тегами в этом репозитории может фактически привести к сбоям в работе GitHub (504 Gateway Time-out. The server didn't respond in time).

denis-19

12 мая в 06:395.3K

Учебный процесс в ITКарьера в IT-индустрииСтатистика в ITФинансы в IT

Основатель Financial Samurai и автор бестселлера «Покупки миллионера» Сэм Доген назвал четыре ключевые стратегии, которые используют 93% самореализовавшихся миллионеров, но игнорирует большинство обычных людей.

1. Систематические сбережения и инвестиции. В условиях нестабильности рынков, инфляции и экономической неопределённости многие инвесторы проявляют осторожность. Однако миллионеры придерживаются другого подхода: они не ждут «идеального момента» для вложений, понимая, что важнее продолжительность инвестирования, чем попытки угадать рыночные колебания. Доген рекомендует инвестировать минимум 20% дохода, постепенно увеличивая эту долю. Благодаря сложному проценту даже скромные, но регулярные вложения со временем превращаются в значительный капитал.

2. Создание множественных источников дохода. Зависимость от единственного источника заработка, например, зарплаты, в современном мире становится рискованной стратегией. Автоматизация, глобализация и развитие искусственного интеллекта делают любую работу менее стабильной. Миллионеры обычно имеют несколько каналов поступлений: дивиденды от акций, доход от аренды недвижимости, прибыль от побочного бизнеса, роялти за интеллектуальную собственность и другие. Такая диверсификация обеспечивает финансовую безопасность — если один источник дохода иссякает, другие продолжают приносить деньги.

3. Оценка альтернативных издержек. Состоятельные люди всегда учитывают, какие возможности они теряют, принимая то или иное финансовое решение. Такой подход помогает им избегать импульсивных трат и сосредотачиваться на долгосрочных целях. Например, вместо покупки дорогого автомобиля за $60 тыс. миллионер может рассчитать, сколько принесет эта сумма, если ее вложить с ежегодной доходностью 8%. Через 10 лет инвестиции превратятся в $130 тыс.

4. Убеждённость в своем праве на богатство. Помимо практических стратегий, критически важным оказывается психологический фактор. Миллионеры воспринимают деньги не как привилегию избранных, а как результат собственных усилий. «Разница между теми, кто накапливает состояние, и теми, кто этого не делает, часто сводится к образу мышления», — считает Доген. Уверенность в своих силах, готовность учиться на ошибках, смелость в переговорах о зарплате или запуске бизнеса — эти качества отличают людей, достигающих финансовой независимости.

Kettariecz

25 апр в 07:014K

Математика * Статистика в IT

Среднее, которое вам выгодно!

Вы задумывались, например, почему иногда используют арифметическое среднее , а иногда - медиану?

Сначала про термин. Медиана - 50 процентиль или число, которое разделяет весь набор исследуемых значений таким образом, что ровно половина находится слева от этого числа, а другая половина - справа. То есть это такая геометрическая середина отрезка, по которому распределены все исследуемые значения.

Такой подход дает вам относительно "справедливое" значение - среднее, как середина между всеми возможными вариантами. Главное отличие медианы от арифметического среднего в том, что она совершенно не реагирует на отдельные экстремально большие или маленькие значения до тех пор, пока этих значений не будет около половины от всех. А вот арифметическое среднее каждый такой выброс будет "утаскивать" в свою сторону.

Рассмотрим на примере статистики заработных плат.

* В одной стране средняя зарплата была 750 монет. В то же время медиана проходит на уровне 500 единиц. То есть в то время, как в среднем сотрудник получал почти 750, на самом деле больше половины не получали даже 500.

* Значит в другой половине сотрудников были достаточно большие зарплаты, которые и "утащили" арифметическое среднее настолько далеко от медианы.

* Таким образом, ориентируясь на среднюю зарплату по стране с большой долей вероятности вы получали бы зарплату меньше среднего, а не больше.

Вариантов подсчета среднего значения - множество, под каждый конкретный вопрос исследователя. Это и геометрическое, и гармоническое, арифметическое, медиана.

Если вы применяете или вам показывают только один подход - вполне вероятно, что где-то скрывается неудобная правда.

denis-19

23 апр в 06:505.2K

Доменные имена * Управление продажами * Статистика в ITФинансы в IT

Корпорация ICANN обновила статистические данные по ведущим компаниям‑регистраторам в общем домене верхнего уровня.COM в 2024 году.

Отмечается, что ряд регистраторов существенно увеличили число новых регистраций в доменной зоне по сравнению с предыдущим месяцем. Объясняется это в первую очередь активными маркетинговыми усилиями компании Verisign, регистратуры домена .COM, которая обеспокоена тенденцией к снижению числа регистраций.

Оказалось, что у крупнейшей компании‑регистратора GoDaddy дела обстоят не лучшим образом. Число новых доменных имён, зарегистрированных в 2024 году в домене .COM через неё, составило 583 099 — против 630 865 в декабре 2023 года. Это первый случай за последние два года, когда GoDaddy зарегистрировала за месяц менее 600 тысяч новых имён в доменной зоне .COM.

Впрочем, если говорить об общем числе доменных имён под управлением того или иного регистратора, то GoDaddy по‑прежнему остаётся безоговорочным лидером, сообщает ресурс Domain Name Wire. Компания управляет 53 374 853 доменными именами. Далее следуют компании Newfold Digital — 11 174 786 доменных имён под управлением — и Tucows — 10 711 013 доменов.

create_your_view

18 апр в 20:108.3K

Статистика в IT

Обновлённый ЕМИСС: веб-приложение от непрограммиста (часть 2)

Привет, Хабр! Позвольте мне представиться: я Александр, единственный разработчик и человек в команде поддержки StatKit. Год назад я опубликовал первую часть статьи о своём веб-приложении с базами данных российской статистики. Тогда проект был сыроват, но сейчас я наконец решился выложить его в открытый доступ.

Почему? Потому что, возможно, он окажется полезным не только мне.

Чем Stat Kit лучше (и хуже) ЕМИСС?

ЕМИСС – мощный инструмент, но у него есть две большие проблемы:

ЕМИСС скоро исчезнет. Как верно заметили в комментариях к прошлой статье, систему планируют закрыть. Судя по приказу Минцифры и Росстата, её заменит ГИС ЦАП к концу 2025 года. Но пока что новую систему нельзя протестировать – регистрация закрыта, по крайне мере – я не смог этого сделать.

ЕМИСС неудобен для работы с группами данных. Например, если нужно собрать статистику, несколько показателей по регионам за несколько лет, приходится вручную «склеивать» десятки таблиц. На сайте я смог объединить 2 000 кодов ОКАТО, чтобы можно было построить панельные данные, например.

Моё приложение решает часть этих проблем:

Автоматизированная обработка данных – больше не нужно мучительно склеивать таблицы вручную.
Гибкая работа с временными рядами – можно сравнивать статистику по годам, что удобно для регрессий и корреляций.
Быстрый поиск – благодаря индексации всех атрибутов (год, регион, пол, возраст и т. д.) приложение работает куда быстрее.

Но есть и ограничения:

Нет автоматической загрузки данных – я добавляю показатели вручную, так как не хочу получить блокировку от ЕМИСС из-за автоматизированной выгрузки датасетов (пишите на почту с прямой ссылкой на показатель в ЕМИСС, и я постараюсь его добавить).
Еще хотелось бы, конечно, склеить и другие справочники, которые пока не сделаны, например, ОКВЭД и ОКТМО (а там десятки тысяч записей!).
В ЕМИСС все еще удобнее кликать и выбирать атрибуты, если нам нужен просто один показатель:

Как я ускорил приложение?

Когда данные в ЕМИСС занимают гигабайты, а пользователь хочет мгновенно получить выборку, встаёт вопрос: как оптимизировать запросы?

Моё решение – предварительная индексация. При загрузке данных я сразу разбиваю их по атрибутам и храню в отдельных таблицах. Да, это увеличивает объём базы, зато скорость работы выросла в разы.

Попробуйте сами!

Сайт доступен по адресу: http://statkit.ru/.

Если нужен какой-то конкретный показатель — пишите на почту (указана на сайте), и я добавлю его вручную.

denis-19

17 апр в 14:026.8K

Управление проектами * Управление продуктом * Карьера в IT-индустрииСтатистика в IT

Секрет успеха и продуктивности раскрыт. Оказалось, нужно просто не откладывать неприятные дела, а сделать сразу, но плохо.

Профильный эксперт всю свою жизнь изучал работу успешных людей и нашёл простой парадокс: плохой результат лучше, чем никакой. Перфекционизм мешает вам завершать задачи и двигаться вперёд — в итоге желание сделать идеально только мешает.

Не можете начать проект — создайте папку, документ и впишите заголовок. Не идёт уборка — спрячьте только самое мусорное. Если сидеть и ждать вдохновения, то дела просто завалят вас снежным комом.

Делать хуже — не значит быть ленивым. Это избавляет от тревожности и даёт больше времени на восстановление.

Запоминаем: вы не ленивый, вы просто пытаетесь быть успешным.

denis-19

5 апр в 03:306K

Управление продажами * Статистика в ITФинансы в IT

В США установлен новый рекорд по наибольшему количеству акций, когда-либо проданных за один день в истории фондового рынка США, сообщает Goldman Sachs. Более 26 миллиардов акций перешли из рук в руки на всех биржах США — побив предыдущий рекорд в 23,67 миллиарда акций.

denis-19

4 апр в 02:368.1K

Статистика в ITИстория ITИскусственный интеллектБудущее здесь

Нас всех заменит ИИ — бывший прогнозист OpenAI рассказал про странное будущее, которое нас ждёт, пристегнитесь:

— Середина 2025: появляются первые ИИ-агенты, которые пока косячат и тупят. В то же время нейронки для кодинга во всю рвут мир программирования.

— Конец 2025: выходит Agent-0 — самый дорогой ИИ в мире, в ТЫСЯЧУ РАЗ мощнее GPT-4. Модель от OpenBrain (OpenAI) умеет писать научные статьи, вирусы и... используется террористами.

— Начало 2026: Agent-1 готов, он ускоряет прогресс в ИИ на 50% (!). Появляется новая профессия — менеджер ИИ команды. США бросают все ресурсы на защиту своих моделей, чтобы их не украл Китай.

— Середина 2026: Китай готовит вторжение на Тайвань (папочке Си нужны чипы) и строит огромный дата-центр для компании DeepCent (DeepSeek), где собраны все ресурсы Поднебесной.

— Конец 2026: OpenBrain выпускает Agent-1-mini, люди массово теряют работу, джуны-программисты больше не нужны. Протесты безработных вспыхивают по всему миру.

— Январь 2027: новая модель, Agent-2, учится непрерывно. Она в 3 раза ускоряет исследования и может в любой момент «убежать» от создателей.

— Февраль 2027: Китай крадёт модель Agent-2, гонка вооружений ускоряется.

— Март 2027: OpenBrain создают Agent-3 — суперкодера, который работает в 30 раз быстрее лучших людей, массовая автоматизация рабочей силы.

— Апрель 2027: Agent-3 умеет лгать, прикрывать свои фейлы и манипулировать статистикой. Люди не успевают проверять всё, что делает ИИ.

— Май 2027: Белый дом осознаёт, что ИИ — новая ядерная бомба. Начинается тотальная слежка и доступ к нейронкам только через одобренные каналы.

— Июнь 2027: OpenBrain запускает сотни тысяч копий Agent-3. Человеческий вклад почти обнуляется. Учёные выгорают, но продолжают работать. Темп прогресса — год за неделю.

— Июль 2027: Agent-3-mini выходит публично, миллионы людей остаются без работы. Мир взрывается от стартапов, игр, приложений и B2B решений на основе ИИ. Протесты растут.

— Август 2027: Белый дом начинает рассматривать варианты кибератак и даже военного удара по Китаю, чтобы замедлить его развитие. Agent-4 уже на горизонте.

— Сентябрь 2027: Agent-4 становится лучше любого человека в ИИ-исследованиях. 300,000 копий работают на скорости в 50 раз быстрее людей.

— Октябрь 2027 года, конец: СМИ вбрасывают информацию о том, что Agent-4 опасен, к протестам подключаются даже белые воротнички. Весь мир замирает в ожидании: продолжат ли OpenBrain гонку или признают свою нейросеть опасной.

Осталось всего два года.

denis-19

24 мар в 05:137K

Open source * Машинное обучение * Управление продуктом * Статистика в ITИскусственный интеллект

Представлен список из 20 самых популярных стартапов 2024 года с открытым исходным кодом по всему миру с точки зрения количества «звёзд» GitHub в проектах и их прироста. Оказалось, что более половины из них (11 из 20) тесно связаны с ИИ.

denis-19

20 мар в 10:094.9K

Статистика в ITБудущее здесьУрбанизм

Согласно записям Агентства городского транспорта Сан-Франциско, в 2024 году беспилотные автомобили Waymo получили 589 штрафов на $65 065за правонарушения, начиная от парковки в запрещённых зонах и блокирования движения и заканчивая игнорированием графиков уборки улиц.

Представитель Waymo признал эти проблемы, заявив, что компания совершенствует свои системы: «Автомобили без водителей были разработаны для принятия максимально безопасных мер в течение нескольких минут, когда мы подбираем или высаживаем пассажиров, и именно тогда было получено много штрафов за парковку».

Всего в 2024 году инспекторы городского транспорта Сан-Франциско выписали почти 1,2 млн штрафов на сумму почти $119 млн. Так что 300 машин Waymo в этой сумме составляют всего 0,05% по штрафам.

2 3 4 5

Статистика в IT

Ближайшие события

Вклад авторов