Обновить
34.32

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Прогнозирование исходов футбольных матчей в реальном времени с помощью байесовской модели

Уровень сложностиСложный
Время на прочтение26 мин
Охват и читатели1.9K

Ставки в реальном времени очень популярны, и поэтому прогнозирование в реальном времени заслуживает особого внимания. Однако среди огромного количества литературы по прогнозированию футбольных матчей лишь немногие статьи сосредоточены на прогнозировании в реальном времени. Разбираем сложную модель калибровки динамической силы команд, основанную на байесовском методе, которая позволяет использовать информацию о текущем матче для калибровки оценок силы каждой команды.

Читать далее

FEDOT, да не тот

Время на прочтение6 мин
Охват и читатели870

Привет, Хабр!
Меня зовут Марина, я Head of Analytics and ML в SENSE, занимаюсь анализом данных уже более 5 лет. Сначала препарировала спектры в физике высоких энергий и сотрудничала с ЦЕРН-ом, а теперь строю рекомендательные системы и аналитику.

В статье расскажу про опыт работы с пакетом FEDOT для прогнозирования временных рядов. Статья пригодится тем, кто хочет вкатиться в тему временных рядов и потыкать свои первые модельки на примере отечественных библиотек. Объясняю на примере задачи прогнозирования выходов кандидатов.

Дисклеймер: во временных рядах я только начинаю свой путь, так что делюсь всеми своими фейлами и буду рада обратной связи в комментах.

Читать далее

Сервисы финучета: обзор и сравнение

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.8K

Автоматизировать финучет в нашей IT-команде оказалось сложнее, чем казалось. Проекты как лоскутное одеяло, бюджеты то есть, то нет, а чеки терялись быстрее, чем мы успевали их собрать. Я перепробовал несколько сервисов, наделал ошибок, кое-где попал в тупик, но в итоге нашел рабочее решение. В статье рассказываю, что мы тестировали, что подошло, а что нет. Где реально удобно, а где слишком заморочено.

Читать далее

BI в тестировании — сравнение результатов бенчмарков двух веток с помощью однофакторного ANOVA (критерий Кохрена-Кокса)

Время на прочтение5 мин
Охват и читатели607

Business Intelligence (BI) находит применение в самых разных сферах, в том числе, например, при анализе результатов бенчмарков. Часто возникает задача сравнения производительности двух версий приложения на основе результатов бенчмарков (время выполнения тестов для нескольких прогонов и нескольких тестов), например, сравнение master ветки и feature ветки. Улучшение производительности в feature ветке (особенно, если она для улучшения производительности и создавалась) проверить можно условно и вручную, но также важно проверить, что нет деградации в других кейсах бенчмарков для feature ветки по сравнению с master веткой. Это можно решить статистическими методами, например, достаточно однофакторного дисперсионного анализа (ANOVA), здесь будет рассмотрен критерий Кохрена-Кокса, особенности его имплементации на PostgreSQL и возможные виды графиков для представления результатов. Интересующимся применением BI и ANOVA для сравнения производительности двух версий приложения на бенчмарках — добро пожаловать под кат :)

Читать далее

Линейная регрессия: как стать магом предсказаний с помощью статистических методов

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели911

Многие из нас мечтали бы заглянуть в будущее — ведь это по-настоящему полезный навык. А что, если я скажу, что при помощи математики можно приблизиться к этой мечте? Да, с некоторыми оговорками, но в этой статье мы попробуем почувствовать себя настоящим Докторам Стрэнджам и предсказать какую кассу соберет фильм при определенном бюджете.

Сегодня мы простыми словами разберёмся, что такое линейная регрессия и напишем код на Python, который демонстрирует работу линейной регрессии.

Читать далее

Охотники за онлайн-ресурсами. Часть 2: сложные веб-атаки и погоня за API

Время на прочтение3 мин
Охват и читатели743

Всем привет! В предыдущем посте мы рассказали, как хакеры атаковали онлайн-ресурсы российских компаний в 2024 году – какие отрасли вызывали у хакеров наибольший интерес и какие методики актуальны сегодня. В этой, финальной части мы поделимся статистикой сложных веб-атак за прошедший год и покажем аналитику атак на API, а также такие веб-приложения российских организаций, как Confluence, Jira и OWA.

Читать далее

Мировой трафик вырос на 17,2%. Что ещё в отчёте Cloudflare за 2024 год?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели1.4K

Компания Cloudflare опубликовала отчёт «Обзор 2024 года» — подробный документ, в котором рассматриваются ключевые тенденции и закономерности, сформировавшиеся в интернете за последний год.

В рамках этой ежегодной традиции (начавшейся в 2020 году) Cloudflare собирает информацию из своей довольно обширной глобальной сети и набора данных и превращает все эти данные в историю о том, как развивается онлайн-мир.

Буду с вами честен - я впервые обращаю внимание на этот отчёт. Меня действительно поразили выводы, к которым они пришли. Это возможность для всех нас (владельцев сайтов) изучить силы, стоящие за интернетом, которым мы пользуемся каждый день, и, возможно, пройти 2025 году чуть более подготовленными. 👍

(Вы можете прочитать оригинал отчета здесь.)

Читать далее

Байесовская оценка А/Б-тестов

Время на прочтение43 мин
Охват и читатели2.1K

Описана механика А/Б-тестов. Рассмотрены примеры байесовского моделирования. Байесовская оценка применена к сравнению конверсий, средних с помощью центральной предельной теоремы, выручки на пользователя, заказов на посетителя.

Читать

Распили её правильно. А/В разрез генеральной совокупности

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели415

В написании этой статьи ни один ИИ не пострадал участвовал. Весь текст написан с помощью мощного естественного интеллекта автора

В настоящее время АВ тестирование приобрело всеобъемлющий и неоспоримый формат исследования своих действий в предложении товаров и услуг, да и любого исследования человеческих сообществ.

И главное, что всё просто - берете исследуемое множество, выделяете часть и исследуете эту часть. В надежде, что свойства этой части такие, же как и у всего сообщества.

Главное тут - правильно разделить.

посмотри на А/В тест с другой стороны

Spotify становится прибыльным

Время на прочтение2 мин
Охват и читатели5.8K

Не так давно вышел мини-сериал «Плейлист» («The playlist»), снятый по книге «Spotify Untold». Фильм рассказывает историю рождения стартапа - шведской музыкальной потоковой компании Spotify. (!Рекомендуется к просмотру)

Развитие потоковой передачи музыки привело глобальные доходы от «записанной» музыки к новым рекордным максимумам. Этот всплеск в первую очередь обусловлен появлением Spotify. Когда Spotify запустил свой музыкальный стриминговый сервис в 2008 году, мало кто мог подумать, что этот малоизвестный стартап из Стокгольма в конечном итоге вырастет в самую популярную в мире музыкальную платформу, у которого более 600 млн активных пользователей в месяц и 36 % мирового аудиостриминга.

Читать далее

Causal Inference методы на практике

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели3.3K

Обычно, когда возникает необходимость оценить эффект от продуктовой фичи, аналитики проверяют гипотезы через A/B эксперименты. Но иногда запустить эксперимент нет возможности, а оценить эффект все еще хочется. Столкнувшись в очередной раз с такой ситуацией, я решил погрузиться в нашумевший в последнее время мир причинно-следственного анализа или Causal Inference и поделиться опытом применения различных подходов на практике.

Случалось ли с вами что-нибудь из этого?

Читать далее

Расширенный CUPAC для снижения дисперсии в A/B экспериментах

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели1.5K

Задача снижения дисперсии при проведении A/B экспериментов, кажется, никогда не перестанет быть актуальной. Хочу поделиться небольшим разбором свежей статьи, в которой авторы предлагают еще один довольно-таки провокационный метод для снижения дисперсии.

Читать далее

Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Время на прочтение10 мин
Охват и читатели938

Метод CUPED уже давно завоевал популярность в анализе A/B-тестов, предоставляя возможность выявлять эффекты меньших размеров. В этой статье мы подробно рассмотрим применение данного подхода на этапе дизайна эксперимента. Мы исследуем, как можно сократить размеры выборок, не теряя при этом в статистической мощности теста.

Читать далее

Ближайшие события

Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели2.6K

Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат

Предиктивная аналитика кардинально меняет подход к обслуживанию и управлению промышленным оборудованием. В условиях цифровой трансформации бизнеса, особенно в производственном секторе, она становится незаменимым элементом для повышения эффективности, минимизации простоев и снижения затрат. Рассмотрим, как предиктивная аналитика помогает промышленным компаниям достигать стратегических целей и что важно учитывать при её внедрении.

Читать далее

Экспресс-исследование корпоративных коммуникаций в России 2023

Время на прочтение6 мин
Охват и читатели3.7K

Результаты опроса 500 верифицированных специалистов, которые внедряют и обслуживают системы видеосвязи и корпоративные мессенджеры. География: 13 городов России.

Читать далее

Учимся анализировать данные на примере API Codewars

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели5.4K

Для начинающего специалиста, входящего в мир ИТ, одной из приоритетных задач трудоустройства является отработка и получение навыков хотя бы в одном (а лучше нескольких) языках программирования.

Мой опыт через решение алгоритмических задач показал, что этот метод помогает развить системное мышление. В жизни и в работе данный навык очень важен, поскольку существуют задачи, требующие нестандартного подхода к их решению.

Читать далее

Азия — рай для хакеров: тайна самого цифровизированного региона планеты

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.8K

Последние несколько десятилетий именно Азиатский регион ассоциируется с инновациями и технологическим прогрессом. Это одновременно и дар, и проклятье Азии — стремительное цифровое развитие повышает привлекательность региона для проведения хакерских атак. В 2022 году около трети всех успешных атак в мире пришлись на Азиатско-Тихоокеанский регион — больше, чем на какой-либо другой. Если местные правительства и организации не примут меры, ситуация может ухудшиться.

Как действуют злоумышленники в Азии, что им нужно и как с ними бороться — в полной версии нашего исследования, а в этом материале — немного про хакерский рай.

Читать далее

Статистика QA вакансий и резюме. Октябрь 2023

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели11K

Раз в месяц я и команда QA Studio вручную собираем статистику по вакансиям и резюме тестировщиков с нескольких ресурсов. Сегодня — статистика за октябрь. Мы не делаем выводы, а оставляем сухие цифры. Много или мало открытых вакансий и что с рынком — каждый может интерпретировать по-своему.

Посмотреть статистику

Исследование рынка ИТ-вакансий: годовой рост составил 18%

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели30K

Мы проанализировали спрос на ИТ-специалистов в России за период с сентября 2022 года по сентябрь 2023 года. Одни из самых востребованных вакансий — системные и бизнес аналитики, менеджеры проектов и продуктов, а также Java-разработчики.

Читать далее

Статистика QA вакансий и резюме. Сентябрь 2023

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.8K

Раз в месяц я и команда QA Studio вручную собираем статистику по вакансиям и резюме тестировщиков с разных ресурсов. Сегодня — статистика за сентябрь. Мы не делаем выводы, а оставляем сухие цифры. Много или мало открытых вакансий и что с рынком — каждый может интерпретировать по-своему.

Посмотреть статистику