Как стать автором
Обновить
56.69

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга

Среднее, которое вам выгодно!

Вы задумывались, например, почему иногда используют арифметическое среднее , а иногда - медиану?



Сначала про термин. Медиана - 50 процентиль или число, которое разделяет весь набор исследуемых значений таким образом, что ровно половина находится слева от этого числа, а другая половина - справа. То есть это такая геометрическая середина отрезка, по которому распределены все исследуемые значения.

Такой подход дает вам относительно "справедливое" значение - среднее, как середина между всеми возможными вариантами. Главное отличие медианы от арифметического среднего в том, что она совершенно не реагирует на отдельные экстремально большие или маленькие значения до тех пор, пока этих значений не будет около половины от всех. А вот арифметическое среднее каждый такой выброс будет "утаскивать" в свою сторону.

Рассмотрим на примере статистики заработных плат.

* В одной стране средняя зарплата была 750 монет. В то же время медиана проходит на уровне 500 единиц. То есть в то время, как в среднем сотрудник получал почти 750, на самом деле больше половины не получали даже 500.

* Значит в другой половине сотрудников были достаточно большие зарплаты, которые и "утащили" арифметическое среднее настолько далеко от медианы.

* Таким образом, ориентируясь на среднюю зарплату по стране с большой долей вероятности вы получали бы зарплату меньше среднего, а не больше.

Вариантов подсчета среднего значения - множество, под каждый конкретный вопрос исследователя. Это и геометрическое, и гармоническое, арифметическое, медиана.

Если вы применяете или вам показывают только один подход - вполне вероятно, что где-то скрывается неудобная правда.

Теги:
+2
Комментарии0

Корпорация ICANN обновила статистические данные по ведущим компаниям‑регистраторам в общем домене верхнего уровня.COM в 2024 году.

Отмечается, что ряд регистраторов существенно увеличили число новых регистраций в доменной зоне по сравнению с предыдущим месяцем. Объясняется это в первую очередь активными маркетинговыми усилиями компании Verisign, регистратуры домена .COM, которая обеспокоена тенденцией к снижению числа регистраций.

Оказалось, что у крупнейшей компании‑регистратора GoDaddy дела обстоят не лучшим образом. Число новых доменных имён, зарегистрированных в 2024 году в домене .COM через неё, составило 583 099 — против 630 865 в декабре 2023 года. Это первый случай за последние два года, когда GoDaddy зарегистрировала за месяц менее 600 тысяч новых имён в доменной зоне .COM.

Впрочем, если говорить об общем числе доменных имён под управлением того или иного регистратора, то GoDaddy по‑прежнему остаётся безоговорочным лидером, сообщает ресурс Domain Name Wire. Компания управляет 53 374 853 доменными именами. Далее следуют компании Newfold Digital — 11 174 786 доменных имён под управлением — и Tucows — 10 711 013 доменов.

Теги:
0
Комментарии0

Обновлённый ЕМИСС: веб-приложение от непрограммиста (часть 2)

Привет, Хабр! Позвольте мне представиться: я Александр, единственный разработчик и человек в команде поддержки StatKit. Год назад я опубликовал первую часть статьи о своём веб-приложении с базами данных российской статистики. Тогда проект был сыроват, но сейчас я наконец решился выложить его в открытый доступ.

Почему? Потому что, возможно, он окажется полезным не только мне.

Чем Stat Kit лучше (и хуже) ЕМИСС?

ЕМИСС – мощный инструмент, но у него есть две большие проблемы:

ЕМИСС скоро исчезнет. Как верно заметили в комментариях к прошлой статье, систему планируют закрыть. Судя по приказу Минцифры и Росстата, её заменит ГИС ЦАП к концу 2025 года. Но пока что новую систему нельзя протестировать – регистрация закрыта, по крайне мере – я не смог этого сделать.

ЕМИСС неудобен для работы с группами данных. Например, если нужно собрать статистику, несколько показателей по регионам за несколько лет, приходится вручную «склеивать» десятки таблиц. На сайте я смог объединить 2 000 кодов ОКАТО, чтобы можно было построить панельные данные, например.

Моё приложение решает часть этих проблем:

  • Автоматизированная обработка данных – больше не нужно мучительно склеивать таблицы вручную.

  • Гибкая работа с временными рядами – можно сравнивать статистику по годам, что удобно для регрессий и корреляций.

  • Быстрый поиск – благодаря индексации всех атрибутов (год, регион, пол, возраст и т. д.) приложение работает куда быстрее.

Но есть и ограничения:

  • Нет автоматической загрузки данных – я добавляю показатели вручную, так как не хочу получить блокировку от ЕМИСС из-за автоматизированной выгрузки датасетов (пишите на почту с прямой ссылкой на показатель в ЕМИСС, и я постараюсь его добавить).

  • Еще хотелось бы, конечно, склеить и другие справочники, которые пока не сделаны, например, ОКВЭД и ОКТМО (а там десятки тысяч записей!).

  • В ЕМИСС все еще удобнее кликать и выбирать атрибуты, если нам нужен просто один показатель:

Выбор показателя в ЕМИСС
Выбор показателя в ЕМИСС

Как я ускорил приложение?

Когда данные в ЕМИСС занимают гигабайты, а пользователь хочет мгновенно получить выборку, встаёт вопрос: как оптимизировать запросы?

Моё решение – предварительная индексация. При загрузке данных я сразу разбиваю их по атрибутам и храню в отдельных таблицах. Да, это увеличивает объём базы, зато скорость работы выросла в разы.

Попробуйте сами!

Сайт доступен по адресу: http://statkit.ru/.

Если нужен какой-то конкретный показатель — пишите на почту (указана на сайте), и я добавлю его вручную.

Теги:
+2
Комментарии0

Секрет успеха и продуктивности раскрыт. Оказалось, нужно просто не откладывать неприятные дела, а сделать сразу, но плохо.

Профильный эксперт всю свою жизнь изучал работу успешных людей и нашёл простой парадокс: плохой результат лучше, чем никакой. Перфекционизм мешает вам завершать задачи и двигаться вперёд — в итоге желание сделать идеально только мешает.

Не можете начать проект — создайте папку, документ и впишите заголовок. Не идёт уборка — спрячьте только самое мусорное. Если сидеть и ждать вдохновения, то дела просто завалят вас снежным комом.

Делать хуже — не значит быть ленивым. Это избавляет от тревожности и даёт больше времени на восстановление.

Запоминаем: вы не ленивый, вы просто пытаетесь быть успешным.

Теги:
+5
Комментарии2

В США установлен новый рекорд по наибольшему количеству акций, когда-либо проданных за один день в истории фондового рынка США, сообщает Goldman Sachs. Более 26 миллиардов акций перешли из рук в руки на всех биржах США — побив предыдущий рекорд в 23,67 миллиарда акций.

Теги:
0
Комментарии0

Нас всех заменит ИИ — бывший прогнозист OpenAI рассказал про странное будущее, которое нас ждёт, пристегнитесь:

— Середина 2025: появляются первые ИИ-агенты, которые пока косячат и тупят. В то же время нейронки для кодинга во всю рвут мир программирования.

— Конец 2025: выходит Agent-0 — самый дорогой ИИ в мире, в ТЫСЯЧУ РАЗ мощнее GPT-4. Модель от OpenBrain (OpenAI) умеет писать научные статьи, вирусы и... используется террористами.

— Начало 2026: Agent-1 готов, он ускоряет прогресс в ИИ на 50% (!). Появляется новая профессия — менеджер ИИ команды. США бросают все ресурсы на защиту своих моделей, чтобы их не украл Китай.

— Середина 2026: Китай готовит вторжение на Тайвань (папочке Си нужны чипы) и строит огромный дата-центр для компании DeepCent (DeepSeek), где собраны все ресурсы Поднебесной.

— Конец 2026: OpenBrain выпускает Agent-1-mini, люди массово теряют работу, джуны-программисты больше не нужны. Протесты безработных вспыхивают по всему миру.

— Январь 2027: новая модель, Agent-2, учится непрерывно. Она в 3 раза ускоряет исследования и может в любой момент «убежать» от создателей.

— Февраль 2027: Китай крадёт модель Agent-2, гонка вооружений ускоряется.

— Март 2027: OpenBrain создают Agent-3 — суперкодера, который работает в 30 раз быстрее лучших людей, массовая автоматизация рабочей силы.

— Апрель 2027: Agent-3 умеет лгать, прикрывать свои фейлы и манипулировать статистикой. Люди не успевают проверять всё, что делает ИИ.

— Май 2027: Белый дом осознаёт, что ИИ — новая ядерная бомба. Начинается тотальная слежка и доступ к нейронкам только через одобренные каналы.

— Июнь 2027: OpenBrain запускает сотни тысяч копий Agent-3. Человеческий вклад почти обнуляется. Учёные выгорают, но продолжают работать. Темп прогресса — год за неделю.

— Июль 2027: Agent-3-mini выходит публично, миллионы людей остаются без работы. Мир взрывается от стартапов, игр, приложений и B2B решений на основе ИИ. Протесты растут.

— Август 2027: Белый дом начинает рассматривать варианты кибератак и даже военного удара по Китаю, чтобы замедлить его развитие. Agent-4 уже на горизонте.

— Сентябрь 2027: Agent-4 становится лучше любого человека в ИИ-исследованиях. 300,000 копий работают на скорости в 50 раз быстрее людей.

— Октябрь 2027 года, конец: СМИ вбрасывают информацию о том, что Agent-4 опасен, к протестам подключаются даже белые воротнички. Весь мир замирает в ожидании: продолжат ли OpenBrain гонку или признают свою нейросеть опасной.

Осталось всего два года.

Теги:
0
Комментарии10

Представлен список из 20 самых популярных стартапов 2024 года с открытым исходным кодом по всему миру с точки зрения количества «звёзд» GitHub в проектах и их прироста. Оказалось, что более половины из них (11 из 20) тесно связаны с ИИ.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии1

Согласно записям Агентства городского транспорта Сан-Франциско, в 2024 году беспилотные автомобили Waymo получили 589 штрафов на $65 065за правонарушения, начиная от парковки в запрещённых зонах и блокирования движения и заканчивая игнорированием графиков уборки улиц.

Представитель Waymo признал эти проблемы, заявив, что компания совершенствует свои системы: «Автомобили без водителей были разработаны для принятия максимально безопасных мер в течение нескольких минут, когда мы подбираем или высаживаем пассажиров, и именно тогда было получено много штрафов за парковку».

Всего в 2024 году инспекторы городского транспорта Сан-Франциско выписали почти 1,2 млн штрафов на сумму почти $119 млн. Так что 300 машин Waymo в этой сумме составляют всего 0,05% по штрафам.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

SensorTower представила статистку по монетизации мобильных приложений. Вверху — количество мобильных приложений или игр, в которых пользователи потратили за календарный год более $10 млн. В 2024 году таких приложений 1569. Всего приложений и игр, например, в App Store около 2,3 млн. Внизу — приложения, в которых пользователи потратили более $1 млрд за календарные годы с 2014 года по 2024 год.

Теги:
Рейтинг0
Комментарии1

Представлена история дизайна машин «Формулы-1» и гоночных технологий с 1950 года по 2025 год. Это познавательный и информационный портал с исторической статистикой по пилотам. командам и данным по болидам.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии2

Нужен телеком, где болит импортозамещение =)

Рассказываю, зачем.

Помогла провести исследование «Авантелекому»: кто куда переехал с зарубежных АТС и переехал ли. А если не переехал, то почему. Собрали данные более 90 компаний. Среди них и госы, и частники — госсектора больше, 76%.

Если коротко, то результат предсказуемый — за 2 года переехали только 13%, а 47% запланировали миграцию на следующие два года. 9% переезжать и вовсе не планируют. На Хабре результаты публиковать не стали — кажется, что исследование больше бизнесовое, не интересно здесь про это. Но вот он на VC.

Но это исследование не отвечает на самый интересный вопрос — какое из российских решений выбрали в большинстве компаний и почему. И это, как мне кажется, вопрос на Хабр =) Вряд ли этот выбор делают в бизнес-юнитах. Хотя могу ошибаться ¯\_(ツ)_/¯

Если вы выбираете на что мигрировать с зарубежных АТС или уже переехали, давайте все вместе выясним, какое решение самое предпочитаемое и почему.

В форме всего 6 вопросов, отвечать в среднем 5 минут, опрос анонимный. Если оставите емейл, пришлю на него результаты в обезличенном виде.

И вечная благодарочка, конечно =)

Теги:
Рейтинг0
Комментарии0

Международная космическая станция совершила свой 150-тысячный виток вокруг Земли.

11 марта «юбилейный» виток обращения станции вокруг нашей планеты длился с 13:32 мск до 15:05 мск. Это был полёт от острова Суматра (Индонезия) до Индийского океана.

Всего за все время существования (точка отсчета — выведение на орбиту 20 ноября 1998 года первого модуля МКС — функционально-грузового блока «Заря», созданного в России) станция пролетела 6,4 миллиарда километров. Это в 30 раз больше, чем среднее расстояние от Земли до Марса, в четыре раза больше, чем от Земли до Сатурна и почти также далеко как орбита Плутона.

Каждые сутки МКС, полёт которой происходит по орбите высотой более 400 км, совершает в среднем 16 витков вокруг нашей планеты.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Google представила бесплатного ИИ-помощника по Data Science:

  • ИИ-агент не просто генерирует куски кода, сразу создаёт полноценные блокноты.

  • ИИ анализирует, визуализирует и пишет весь код на Python.

  • Всё, что нужно: загрузить любой датасет до 1 Гб и выдать задачу.

  • Нейросеть предложит план и поэтапно обработает все данные.

  • На выходе готовый код или диаграммы.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Ближайшие события

В США нашли получателя пособий возрастом 360 лет и несколько миллионов американцев старше 120 лет, которые также сидят на госвыплатах. Такой список опубликовал Илон Маск. «Возможно, „Сумерки“ реальны, и здесь много вампиров, которые получают социальные пособия», — написал Маск.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии4

Представлена полная версия интерактивной карты мира — TimeMap, которая охватывает всю историю человечества и самые важные события. Можно отследить изменения границ государств, правителей, войны и битвы. И всё это со времён древних шумеров до начала 21 века. Ко всему подвязаны статьи с Вики — можно нажать на любой флаг и быстро узнать историю древнего государства.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

О сколько нам открытий чудных... открытые источники готовят.

И вот очередное подтверждение - глянув на статистику по времени, которое проходит от момента подачи заявки в ФИПС до момента регистрации ПО для ЭВМ можно много чего для себя почерпнуть..

Статистика длительности обработки заявок в ФИПС (в днях) по годам
Статистика длительности обработки заявок в ФИПС (в днях) по годам


Например, вот в раскладке по годам видно, что с 2020 года достигнут рекорд по скорости - минимальная длительность обработки заявки составила 0 дней.
А вот в 2015-м году была обработана самая долгая заявка - 624 дня (правда календарных, не рабочих) - желающие могут убедиться на сайте найдя заявку №2015619410.

Есть еще много чего, что можно вытянуть еще - жаль, что этой статистики не видно на сайте ФИПС... надеюсь хотя бы внутри эта аналитика проводится.

Ну, а если сообществу интересно более подробно - напишите в комментах - подготовлю развернуто в виде статейки ;-)

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

97% языков программирования в мире используют семантическое версионирование.

Теги:
Рейтинг0
Комментарии0

Институт International IQ Test представил средний IQ стран мира в начале 2025 года, что подчёркивает роль образовательных, культурных и экономических систем в развитии талантов.

Китайцы, иранцы и корейцы стали самыми умными на свете. Россия на шестом месте в мировом рейтинге стран по результатам IQ-тестов, США — на 27 месте.

моз

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии13

Биткоину сегодня исполнилось 16 лет. Первая криптовалюта была запущена 3 января 2009 года.

16 декабря 2024 года курс биткоина впервые превысил $105 тыс. (более 10,8 млн рублей).

Текущая рыночная капитализация биткоина составляет около $1,91 трлн, что уже больше капитализации Tesla и многих других компаний в мире, кроме пяти самых дорогих: Microsoft, Apple, Nvidia, Amazon и Alphabet.

В марте 2024 года курс биткоина впервые превысил $70 тыс. (более 7 млн рублей).

В начале 2021 года аналитики JPMorgan спрогнозировали, что цена биткоина в долгосрочной перспективе может превысить $146 тыс., а повышенный интерес к криптовалюте может даже понизить стоимость золота.

В 2010 году сайт Bitcoin Faucet раздавал по 5 биткоинов каждому посетителю, который пройдёт капчу. В общей сложности тогда сервис раздал 19 700 BTC.

Теги:
Всего голосов 5: ↑5 и ↓0+6
Комментарии2

Практически факап столетия. В X (Twitter) есть аккаунт «Умер ли Джимми Картер сегодня?», посвящённый 39 президенту США. Последние полгода автор ежедневно постил там «Нет» в разных вариациях. В очередной раз запостив тот же ответ вчера, владелец аккаунта спокойно пошёл спать, а через несколько часов СМИ сообщили, что Джимми Картер скончался в возрасте 100 лет. У автора проекта была всего одна задача...

Теги:
Всего голосов 8: ↑7 и ↓1+7
Комментарии1