Как стать автором
Обновить
31.54

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга

10 марта 2024 года максимальный одновременный онлайн Steam превысил 35,3 млн пользователей.

Предыдущий рекордный показатель игровой платформы составлял 34,3 млн пользователей.

В процессе установки нового рекорда более 11,1 млн пользователей Steam находились в играх. Этот показатель также стал одним из самых высоких на платформе за всё время.

В марте 2023 года максимальный одновременный онлайн в Steam составил 33,5 млн пользователей. За год этот показатель вырос на более чем 800 тыс. игроков.

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Числа, которые должен знать каждый программист в 2024 году и далее:

  • L1 cache reference = 1 ns (1 нс)

  • Branch mispredict = 3 ns (3 нс)

  • L2 cache reference = 4 ns (4 нс)

  • Send 1K bytes over 1 Gbps network = 11 ns (11 нс)

  • Mutex lock/unlock = 17 ns (17 нс)

  • Main memory reference = 100 ns (100 нс)

  • Read 1 MB sequentially from memory = 1 us (1 мкс)

  • Compress 1K bytes with Zippy = 2 us (2 мкс)

  • Read 4K randomly from SSD = 16 us (16 мкс)

  • Read 1 MB sequentially from SSD = 19 us (19 мкс)

  • Read 1 MB sequentially from disk = 474 us (474 мкс)

  • Round trip within same datacenter = 500 us (500 мкс)

  • Disk seek = 2 ms (2 мс)

  • Send packet CA->Netherlands->CA = 150 ms (150 мс)

Графическая визуализация этих и других данных (чисел, констант) для программистов.

Напишите, пожалуйста, в комментариях ваши числа для проектов в 2024 году.

Теги:
Всего голосов 9: ↑5 и ↓4+1
Комментарии4

2 марта 2024 года максимальный одновременный онлайн Steam превысил 34,2 млн пользователей.

Предыдущий рекордный показатель игровой платформы составлял 33,6 млн пользователей.

В процессе установки нового рекорда более 11,1 млн пользователей Steam находились в играх. Этот показатель также стал одним из самых высоких на платформе за всё время.

В марте 2023 года максимальный одновременный онлайн в Steam составил 33,5 млн пользователей. За год этот показатель вырос на 700 тыс. игроков.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Сервис «Облако Mail.ru» представил итоги загрузки файлов за 2023 год. Всего за озвученный год пользователи загрузили около 29,3 млрд файлов. В топ-3 самых часто загружаемых и просматриваемых форматов попали HEIC, PNG и JPG. За 2022 и 2023 года загрузки файлов этих форматов выросли на 29,7%, 12,4% и 7,2% соответственно. Также в пятёрку входят MP4 и PDF.

Доля пользователей «Облако Mail.ru» на iOS среди мобильных платформ составляет 33%. Больше всего пользователи на этой платформе взаимодействовали с форматами HEIC, PNG, MP4 и MOV. Топ-3 по среднему объёму за 2023 год вошли MKV, RAR и AVI.

Теги:
Всего голосов 9: ↑9 и ↓0+9
Комментарии1

Поддельная Makita оказалась лидером продаж среди шурупувертов на Wildberries

Наткнулся на топ шуруповертов на Wildberries и Ozon. В табличках модель, цена за штуку и оборот за три месяца (~август-октябрь 2023). Итак:

  1. Поддельная Makita – абсолютный лидер продаж с оборотом более 30 млн!

  2. Весь топ Wilberries состоит из фейков или самых дешевых моделей недобрендов.

  3. В топ Ozon фейков нет, но на самой площадке полно.

  4. Средний чек на Wildberries и Ozon практически одинаковый — 3162 руб. и 3489 руб.

Что это за Макиты такие – можно посмотреть на картинке. За ~3 тыс. руб. предлагают шуруповерт с двумя аккумуляторами и большим набором насадок, в то время как оригинальный 18-вольтовый с одним аккумулятором стоит от 13,5 тыс.

Примечательна надпись 48V. Можно ли за нее дать статус Deep Fake или это пока просто фейк?

В лучших традициях «Ягодок» возврат сделать затруднительно. Одновременно в отзывах целый фейерверк прозрений. В общем, закажу его попозже для тестов.

P.S. увы, в посте можно разместить только одну картинку. Полноформатные изображения есть вот тут.

Теги:
Всего голосов 10: ↑8 и ↓2+6
Комментарии10

«Яндекс» изучил поисковые запросы программистов и составил карту технических навыков, которые регулярно используют ML-разработчики. Этот проект показывает, какие ML-технологии и методы сейчас особенно популярны, как они связаны между собой и как менялся к ним интерес. 

Размер навыка на карте соответствует его популярности у ML-разработчиков. Положение навыков относительно друг друга определяется сходством контекста: чем чаще два навыка соседствуют с одними и теми же тегами на Stack Overflow, тем меньше расстояние между ними на карте.

Для оценки близости контекста в «Яндексе» рассчитали векторы совстречаемости каждого навыка со всеми остальными, затем нормализовали метрикой TF-IDF. Для укладки навыков на карте использовали алгоритм UMAP.

В дополнение к карте технических навыков «Яндекс» опубликовал рейтинги навыков, интерес к которым сильно вырос в 2023 году по сравнению с 2022 годом. Это десять самых актуальных библиотек и фреймворков и десять ML-технологий и методов. Большинство из них связаны с генеративными моделями и нейросетями для распознавания объектов.

Библиотеки и фреймворки:

  1. langchain;

  2. python-polars;

  3. faiss;

  4. sentence-transformers;

  5. huggingface-datasets;

  6. jax;

  7. stable-baselines;

  8. onnxruntime;

  9. huggingface-transformers;

  10. pytorch-geometric.

ML-технологии и методы:

  1. large-language-model;

  2. stable-diffusion;

  3. openai-api;

  4. gpt-3;

  5. fine-tune;

  6. generative-art;

  7. text-parsing;

  8. hdbscan;

  9. transformer-model;

  10. nlp-question-answering.

Теги:
Всего голосов 6: ↑5 и ↓1+4
Комментарии3

Приложение «Шедеврум» от «Яндекса» вошло в тройку ведущих мировых приложений с генеративным искусственным интеллектом по данным на конец 2023 года. Информацию об этом опубликовала аналитическая компания Data.ai (прежнее название — App Annie) в своём ежегодном исследовании глобального рынка мобильных приложений.

В составленном Data.ai рейтинге приложений с генеративным ИИ «Шедеврум» занимает третью строчку с итоговой оценкой в 95 баллов из 100. Для оценки приложений Data.ai использует собственную метрику — Mobile Performance Score (MPS). При изучении приложений категории, в которую включён «Шедеврум», она учитывает три параметра: количество загрузок и пользователей (acquisition), вовлечённость аудитории (engagement) и оценки пользователей (sentiment). Алгоритмы искусственного интеллекта Data.ai выставляют от 1 до 100 баллов по каждому из них и формируют среднюю оценку.

«Шедеврум» — это мобильное приложение «Яндекса», в котором пользователи могут создавать видео, изображения и тексты с помощью нейросетей. Нейросеть YandexART генерирует картинки и анимацию, а ИИ-система YandexGPT позволяет получать содержательные посты с заголовком и подходящей по смыслу иллюстрацией.

После запуска в апреле 2023 года проект «Шедеврум» попал на первые места по популярности в российских магазинах приложений App Store и Google Play. C тех пор его установили почти 8,5 миллионов пользователей.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Роспатент в 2023 году зарегистрировал 31,9 тыс. программ для ЭВМ и 5,2 тыс. баз данных (БД), следует из подсчетов компании «Онлайн Патент» на основе официальных данных ведомства. Это на 23,3% и 38,8% больше, чем в 2022 году, соответственно. В 2022 году показатели тоже росли относительно 2021 года, но не так активно: с 22,1 тыс. до 25,9 тыс. оформленных прав на ПО и с 3,3 тыс. до 3,7 тыс. прав на БД.

Больше всего свидетельств о регистрации в 2023 году получило управление информационных технологий и связи, подведомственное комитету по информации и связи Санкт-Петербурга. В течение года оно зарегистрировало 503 программы и 270 БД. В случае с ПО, по данным «СПАРК-Интерфакс», речь идёт о компонентах систем «Безопасного города», других городских систем мониторинга и документооборота.

Следующими в списке организаций, наиболее активно регистрировавших права на ПО, идут ТК «Центр» (крупнейший распространитель лотерейных билетов, бренд «Столото») с 440 свидетельствами и ОАО РЖД с 273 свидетельствами.

Базы данных, помимо властей Санкт-Петербурга, активнее всего регистрировали вузы: РАНХиГС, ВШЭ, Сеченовский институт и другие.

Количество патентов, выданных в течение 2023 года, осталось фактически на уровне 2022 года — 30,1 тыс. против 30,4 тыс. до 30,1 тыс. на изобретения и полезные модели. Число патентов на промышленные образцы снизилось на 5,5%, до 5,2 тыс.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

❓100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_19

? Как работает Batch Normalization в PyTorch ? (Часть_2)

  1. Масштабирование и сдвиг: После центрирования и масштабирования активаций, они масштабируются путем умножения на масштабирующий (scaling) коэффициент и сдвигаются путем добавления смещающего (shifting) коэффициента. Эти коэффициенты являются обучаемыми параметрами и оптимизируются вместе с другими параметрами модели.

  2. Вывод активаций: Нормализованные и сдвинутые активации передаются на вход следующего слоя нейронной сети.

  • ? Телеграм-канал: t.me/DenoiseLAB (Если вы хотите быть в курсе всех последних новостей и знаний в области анализа данных);

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

TIOBE Software опубликовала январский рейтинг популярности языков программирования, в котором по сравнению с январём 2023 года выделяется перемещение языка JavaScript с седьмого на шестое место, языка PHP с 10 на 7 место, Scratch с 20 на 10 место (рост популярности на 0.83%), Go — c 12 на 11, Fortran — с 27 на 12 (+0.64%), Object Pascal — c 17 на 13, MatLab — с 15 на 14, Kotlin — с 25 на 17 и Cobol — с 31 на 20.

Языком года назван C#, который сохранил 5 место, но стал лидером по росту популярности (+1.43%).

За год снизилась позиция в рейтинге языков: Visual Basic — с 6 на 8 место, SQL — с 8 на 9, Ассемблер — с 9 на 15, Swift — c 11 на 16, Ruby — с 16 на 18, Rust — c 18 на 19 (при этом популярность Rust выросла на 0.18%).

Рейтинг продолжает возглавлять язык Python, но за год его популярность снизилась на 2.39%. Популярность языка C снизилась на 4.81%, C++ — на 2.95%, а Java — 4.34%.

Индекс популярности TIOBE строит свои выводы на основе анализа статистики поисковых запросов в таких системах, как Google, Bing, Yahoo!, Wikipedia, Amazon, YouTube и Baidu.

В январском рейтинге PYPL, в котором используется Google Trends, тройка лидеров за год не изменилась: первое место занимает язык Python, далее следуют Java и JavaScript. Языки С/C++ поднялись на 4 место, вытеснив язык С# (год назад произошла обратная ротация). По сравнению с январём прошлого года выросла популярность R (+1), Rust (+1), Ada (+2), Dart (+2), Lua (+2), Perl (+1), Haskell (+1).

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии4

❓100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_17

? Можете ли вы объяснить, как работает Prophet для прогнозирования временных рядов ? (Часть_2)

  1. Прогнозирование: После оценки компонентов Prophet создает фрейм данных для прогноза, который включает будущие даты. Затем он использует оцененные параметры для генерации прогнозируемых значений временного ряда и доверительных интервалов.

  2. Визуализация результатов: Prophet предоставляет инструменты для визуализации результатов прогнозирования. Он может построить график исходного временного ряда, прогнозируемых значений и доверительных интервалов, чтобы помочь пользователю оценить качество прогноза.

  • ? Телеграм-канал: t.me/DenoiseLAB (Если вы хотите быть в курсе всех последних новостей и знаний в области анализа данных);

Теги:
Рейтинг0
Комментарии0

❓100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_17

? Можете ли вы объяснить, как работает Prophet для прогнозирования временных рядов ? (Часть_1)

  1. Декомпозиция временного ряда: Prophet автоматически декомпозирует временной ряд на несколько компонентов:

    • Тренд: Prophet моделирует гибкий нелинейный тренд, который может быть линейным или логистическим, в зависимости от данных.

    • Сезонность: Prophet обнаруживает и моделирует периодические сезонные компоненты, такие как ежедневные, еженедельные или ежегодные сезонности.

    • Праздники: Prophet позволяет включить информацию о праздниках и других событиях, которые могут влиять на временной ряд.

  2. Оценка компонентов: Prophet использует метод максимального правдоподобия для оценки параметров тренда, сезонности и праздников в данных. Он оптимизирует функцию потерь, которая учитывает как среднеквадратичную ошибку (MSE) для тренда, так и MSE для сезонности.

  • ? Телеграм-канал: t.me/DenoiseLAB (Если вы хотите быть в курсе всех последних новостей и знаний в области анализа данных);

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Valve установил рекорд по количеству новых релизов на платформе Steam за 2023 год.

Согласно данным SteamDB, в цифровом магазине Valve за 2023 год состоялась премьера 14 531 игры, что больше, чем по сумме релизов в период с 2006 года по 2017 год.

В течение 2023 года в Steam ежедневно выходило в среднем по 40 игр, а каждый месяц — по 1,2 тыс. новых игровых проектов.

Предыдущий годовой рекорд Steam составляет 12 558 тайтлов, он был установлен по итогам 2022 года.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

По данным Евростата, 8,5% онлайн-вакансий, опубликованных в ЕС за период с 4 квартала 2022 года по 3 квартал 2023-го, были связаны со сферой информационно-коммуникационных технологий. Подсчёты основаны на анализе миллионов постов с сотен интернет-джоббордов.

Наибольшей доля онлайн-вакансий для таких специалистов от общего числа объявлений о работе оказалась в Словакии (16,5%). За ней следуют Кипр (14,8%) и Люксембург (14,7%). Меньше всего по сравнению с другими работниками айтишников искали работодатели Словении (3,7%), Финляндии (4,1%) и Хорватии (4,3%).

Большинство (59,1%) вакансий для ИКТ-специалистов, опубликованных в регионе в сети за рассмотренные 12 месяцев, приходятся на разработчиков и аналитиков ПО и  приложений. Вторыми по востребованности стали специалисты по поддержке ИКТ-инфраструктуры и техподдержке пользователей (10,6%), на третьем — специалисты по работе с базами данных и сетями (9,8%).

Самая высокая доля разработчиков и аналитиков среди IT-отрасли ЕС — в Нидерландах, Польше и Австрии. Больше 20% IT-вакансий приходится на технических специалистов в Португалии, Словакии и на Мальте. В Польше и Литве процент таких вакансий самый низкий. В Латвии зафиксирован один из самых высоких процентов объявлений для специалистов по работе с базами данных и сетями от общего пула IT-вакансий страны — второй после Греции.

Теги:
Всего голосов 5: ↑3 и ↓2+1
Комментарии0

Вышла вторая редакция проекта PLB (Programming Language Benchmark) по тестированию производительности решения типовых задач на различных языках программирования. В ней измеряется производительность кода для умножения матриц и решения задачи расстановки 15-ферзей, а также дополнительно оценивает поиск решений в игре Судоку и определение пересечений двух массивов.

Код для тестирования PLB написан на 20 языках программирования. Наиболее высокую производительность показала реализация тестовых приложений на языке C (при компиляции в clang). На втором месте оказался язык Zig, на третьем Nim, на четвёртом Mojo. Далее примерно на одном уровне следуют D, Java, JavaScript-платформа Bun и Rust, а после них Go, Crystal и V.

Высокие результаты показали Node.js, Dart, Lua и C#. Хорошие показатели у Java и C# объясняются использованием отдельной стадии JIT-компиляции, в то время как в Dart, Bun, Node.js, Julia, LuaJIT, PHP, PyPy и Ruby3 (YJIT) JIT-компиляция выполняется на лету и затрагивает только часто выполняемый код. JavaScript-платформа Bun заметно обогнала Node.js. Относительно медленными оказались результаты у Julia и Swift.

Наихудшие показатели производительности выявлены у PHP, Ruby, Perl и CPython, при этом производительность PHP оказалась примерно в 4 раза выше, чем CPython.

Дополнение: В реализации на языках Rust, D и Julia внесены оптимизации, которые позволили Rust занять второе место, D - третье, Julia - 7, а V показал лучший результат в nqueen+matmul.

Источник: OpenNET.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии3

Портал DB-Engines обновил рейтинг популярности СУБД и присудил звание СУБД 2023 года проекту PostgreSQL, который за год продемонстрировал наибольших рост популярности из 417 отслеживаемых систем. Второе место досталось облачной платформе Databricks (за год поднялась с 19 на 17 место), а третье место занял движок Google BigQuery (поднялся с 21 на 19 место).

Ранее PostgreSQL уже признавался СУБД года в 2020, 2018 и 2017 годах. В 2022 году и 2021 году это звание было закреплено за СУБД Snowflake, а в 2019 его получило MySQL, в 2016 - Microsoft SQL Server, в 2015 - Oracle, в 2013 и 2014 годах - MongoDB.

По методике расчёта рейтинг СУБД напоминает рейтинг языков программирования TIOBE и учитывает популярность запросов в поисковых системах, число результатов в поисковой выдаче, объём обсуждений на популярных дискуссионных площадках и в соцсетях, число вакансий в агентствах по найму персонала и упоминаний в профилях пользователей.

Что касается распределения СУБД в рейтинге, PostgreSQL продолжает занимать 4 место, несмотря на наибольший во всем рейтинге рост популярности - 34.11 балла. Рост популярности также демонстрирует проект Databricks и Snowflake. C 8 на 7 место поднялось решение Elasticsearch, а с 33 на 29 - СУБД Firebird, c 44 на 37 - ClickHouse, с 62 на 50 - Prometheus, с 48 на 42 - OpenSearch, с 85 на 76 - TimescaleDB.

Значительное снижение популярности в 2023 году наблюдается у MySQL, Microsoft SQL Server, MongoDB, Redis и SQLite.

Источник: OpenNET.

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии0

За три года Sony продала 50 млн консолей PlayStation 5. Компания смогла справиться с нехваткой компонентов, вызванной проблемами в цепочке поставок на фоне пандемии COVID-19. Запуск игрового устройства состоялся в ноябре 2020 года. PS5 удалось достичь отметки в 50 млн реализованных экземпляров на неделю раньше, чем это потребовалось PlayStation 4.

Японской компании удалось почти в три раза превзойти по продажам Xbox Series X/S от Microsoft. Корпорация не публикует данные о количестве реализованных консолей.

По оценкам Ampere Analysis, Microsoft продала 7,6 млн Xbox Series X/S в 2023 году, что на 15% ниже показателя за 2022 год. Исследователи отмечают, что в текущем году продажи PS5 выросли примерно на 65% и достигли 22,5 млн устройств. В этом году Nintendo реализовала на 18% меньше Switch, чем в прошлом — 16,4 млн.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

❓100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_14 (Часть_1)

Какие подходы могут помочь модели сохранить стабильность популяции при изменении данных?

  1. Кросс-валидация (Cross-Validation): Кросс-валидация позволяет оценить производительность модели на разных подмножествах данных. Например, метод k-fold cross-validation разбивает данные на k подмножеств, называемых фолдами. Модель обучается на k-1 фолдах и оценивается на оставшемся фолде. Этот процесс повторяется k раз, каждый раз используя разные фолды. Таким образом, модель оценивается на различных подмножествах данных, что помогает выявить ее стабильность популяции.

  2. Стратифицированная выборка (Stratified Sampling): При формировании обучающей и тестовой выборок можно использовать стратифицированный подход. Это означает, что при разделении данных на выборки будут сохранены пропорции классов или распределений признаков. Такой подход помогает уменьшить возможное искажение данных при изменении популяции.

    t.me/DenoiseLAB (Еесли вы хотите быть в курсе всех последних новостей и знаний в области анализа данных);

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Опубликованы результаты исследования поддержки кириллических адресов электронной почты наиболее популярными в РФ информационными ресурсами в рамках изучения готовности популярных сайтов к корректной работе с различными видами кириллических e-mail-адресов: содержащих символы кириллицы юникода в локальной части адреса (до знака @) и/или кириллические доменные имена российской национальной доменной зоны (после знака @).

По результатам исследования, уровень принятия ресурсами полностью или частично кириллических e-mail-адресов, демонстрирующий корректность работы форм ввода сайта, составил:

  • 44% сайтов успешно принимают e-mail-адреса с латинскими символами в локальной части адреса и кириллическим доменным именем (вида ascii@юникод.юникод);

  • 34% сайтов успешно принимают e-mail-адреса с кириллической локальной частью и доменным именем на латинице (вида юникод@ascii.ascii);

  • 29% сайтов успешно принимают полностью кириллические e-mail-адреса (вида юникод@юникод.юникод).

Уровень подтверждения полностью или частично кириллических e-mail-адресов, демонстрирующий корректность работы почтовых сервисов, составил:

  • 37% сайтов успешно отправляют письма на e-mail-адреса с латинскими символами в локальной части и кириллическим доменным именем;

  • 3% сайтов успешно отправляют письма на e-mail-адреса с кириллической локальной частью и доменным именем на латинице;

  • 3% сайтов обеспечивают корректную работу со всеми видами кириллических адресов: успешно принимают и отправляют подтверждения на такие адреса.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

«Базальт СПО» рассказал о своих итогах поставок программного обеспечения в образовательные учреждения за три квартала 2023 года. За озвученный период в различные учебные заведения (школы, вузы, средние профессиональные образовательные организации и другие учреждения, связанные с системой образования) было поставлено 77 тысяч лицензий всех операционных систем от российской компании («Альт Образование», «Альт Рабочая станция», «Альт Сервер», «Альт Виртуализация», «Альт СП»), из которых 40 тысяч были поставлены бесплатно, а 37 тысяч лицензий были проданы на сумму ₽27,3 млн.

Из 37 тысяч купленных лицензий 27 685 лицензий ОС «Альт» купили 600 школ, 4852 были куплены 30 вузами, 2667 купили организации дополнительного образования, и средние профессиональные образовательные организации приобрели 1360 лицензий. «Базальт СПО» прогнозирует, что за весь 2023 году общее число лицензий, предоставленных образовательным организациям, превысит 103 тысячи.

По общему количеству лицензий, проданных образовательным организациям, в топ-5 самых активных регионов вошли Московская область (7272 лицензии), Оренбургская область (4836 лицензий), Новосибирская область (3452 лицензии), Свердловская область (3165 лицензий), город Санкт‑Петербург (2479 лицензий).

Теги:
Всего голосов 12: ↑12 и ↓0+12
Комментарии0