Как стать автором
Обновить
34.62

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга
Уровень сложности

Ждет ли безработица ИТ-сектор России

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров38K

Плохие новости для тех, кто думает что «поймал Бога за бороду» выбрав в качестве профессии одну из ИТ специальностей. Индекс HH.ru для профобласти ИТ впервые держится выше значения 8 второй месяц подряд. 

Читать далее
Всего голосов 40: ↑30 и ↓10+33
Комментарии138

Новости

Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение

Время на прочтение29 мин
Количество просмотров782

В прошлой части мы с вами остановились на том, что обнаружили у временного ряда с температурой две сезонности и, несмотря на это, решили двигаться дальше в выполнении сезонной модели САРПСС по методологии АРПСС. В этой части второй главы мы с вами продолжим применение методологии для поиска оптимальных параметров модели, которая будет адекватно описывать целевой временной ряд с температурой.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

Необычные вкусы покупателей: что такое товарные пары и как их исследовать

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров1.7K

Привет, Хабр! На связи команда продуктовой аналитики.

Подбор и обновление ассортимента товаров — постоянная головная боль для любого ритейлера. Это трудоемкий процесс, где каждая ошибка стоит реальных денег. В ecom.tech мы стараемся сделать его проще при помощи автоматизации, а заодно изучаем предпочтения покупателей. На этот раз мы искали, что обычно покупают в паре – так называемые комплементарные товары.

В этой статье расскажем:
- с чем обычно покупают лапшу быстрого приготовления, а с чем — детское питание;
- как география, время суток и другие факторы влияют на выбор покупателей;
- как все эти полученные знания можно применить в ассортиментных матрицах дарксторов и бизнес-процессах ритейла.

Читать далее
Всего голосов 18: ↑18 и ↓0+21
Комментарии0

Вытеснит ли искусственный интеллект людей из мастеринга?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.4K

Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ.

Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.
Читать дальше →
Всего голосов 7: ↑7 и ↓0+15
Комментарии7

Истории

CISQ. Исследование анализа качества ПО 2020 — часть 1

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров531

Консорциум по качеству информации и программного обеспечения (CISQ) запустил опрос «Состояние отрасли» - первое комплексное исследование анализа качества программного обеспечения. В этой статье перевод части результатов опроса - раздела "Инженерия". Во второй части будет перевод оставшихся двух разделов - "Системные интеграторы", "Управление поставщиками".

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Cтатистика Байеса в ML для самых маленьких

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров6.3K

Пожалуй, одна из важнейших тем для подготовки крутых специалистов машинного обучения. Ведь закономерности всегда подлежат какой-то аналитике с точки зрения вероятностей. А как иначе?

🔜 Как вы будете рекомендовать девушек в анкетах знакомств, если не вычислите статистическую вероятность симпатии от огонечков на шести сторисах?

🔜 Как вы будете подсчитывать успех кражи внутренних данных компании в обход NDA?

🔜 Может ограбить банк не такая уж плохая идея с вашими вводными данными?

Байес — это палочка-выручалочка.

По статистике 90% мужчин и девушек, что знают метод МСМС, лучше пахнут и получают на 100% больше взаимных симпатий.

Хотите также? — читайте нашу статью по Байесовской статистике в ML для самых маленьких.

Читать далее
Всего голосов 9: ↑7 и ↓2+9
Комментарии4

Последовательное A/B-тестирование в Netflix. Часть 2: процессы подсчёта

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.4K

Сталкивались вы когда-нибудь с ошибкой при просмотре потокового видео на Netflix? Может — неожиданно останавливался или вовсе не запускался фильм, который вас заинтересовал? В первой части этой серии статей мы рассказали о методологии тестирования канареечных релизов, применяемой к показателям, которые представлены непрерывными потоками данных. Среди таких показателей — «задержка воспроизведения» (play‑delay). Вот комментарий одного из читателей:

«А что если выход нового релиза не связан с изменениями в функционале воспроизведения и потоковой передачи видео? Например — что если в новом релизе будет изменено что-то, ответственное за вход пользователя в систему? Тестируя такой релиз вы, как и в других случаях, так же будете наблюдать за метрикой «задержка воспроизведения»?»

Читать далее
Всего голосов 6: ↑6 и ↓0+14
Комментарии0

Как пакет с пакетами помог аналитику решить задачу для бизнеса, или keep calm and import statsmodels

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.4K

Всем привет!
Меня зовут Сабина, я лидер команды исследователей данных во ВкусВилле. Мы помогаем бизнесу принимать решения, ориентируясь в том числе на данные. 
Сегодня я расскажу об одном таком случае. Статья будет полезна аналитикам, которые хотят перестать беспокоиться и начать использовать линейную регрессию из питоновской библиотеки stasmodels.

Читать далее
Всего голосов 7: ↑7 и ↓0+11
Комментарии2

Анализ вакансий ИТ в Москве: системное администрирование, 2024г

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров9.1K

Прошел еще один год и снова появилась необходимость актуализировать и проанализировать данные по предложениям работы в сфере системного администрирования для дальнейшего планирования заработных плат специалистам уже на 2025 год.

В этот раз мы дополнительно сравним результаты со значениями проведенного анализа в 2022 и 2023 годах.

Цели, условия, методика и формат анализа остались без изменений, их можно прочитать в предыдущих статьях или спойлером ниже. Данные по каждой должности сравним с предыдущими периодами по количеству вакансий и по заработным платам.

Читать далее
Всего голосов 6: ↑6 и ↓0+8
Комментарии5

Удаленка под угрозой: зарубежные компании возвращают людей в офисы. Почему это неизбежно затронет Россию?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров20K

Иногда кажется, что удаленка была с нами всегда. Хотя массово айтишники начали работать из дома лишь с 2020 года из-за пандемии COVID-19. Тогда говорили, что это временная мера и уже через месяц все вернутся в офис. 

Прошло 4 года, пик удаленки позади – работодатели начинают возвращать людей в офисы. Последние, конечно, сопротивляются. Рассказываем, чем мировому бигтеху не угодила удаленка, зачем российские компании стараются заманить людей обратно в офисы и почему удаленка оказалось под угрозой исчезновения. 

Читать далее
Всего голосов 24: ↑20 и ↓4+23
Комментарии134

Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.2K

Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат

Предиктивная аналитика кардинально меняет подход к обслуживанию и управлению промышленным оборудованием. В условиях цифровой трансформации бизнеса, особенно в производственном секторе, она становится незаменимым элементом для повышения эффективности, минимизации простоев и снижения затрат. Рассмотрим, как предиктивная аналитика помогает промышленным компаниям достигать стратегических целей и что важно учитывать при её внедрении.

Читать далее
Всего голосов 3: ↑2 и ↓1+3
Комментарии0

Бутстрап в PySpark

Время на прочтение13 мин
Количество просмотров1.6K

Всем привет! Меня зовут Илья Черников, я аналитик больших данных в X5 Tech, сейчас занимаюсь аналитикой и оценкой активностей CVM маркетинга экспресс-доставки “Пятёрочки”.

В статье я расскажу о том, как мы решали вопрос автоматизации оценки эффективности большого количества маркетинговых кампаний с помощью бутстрапа в PySpark. Я опишу различные подходы к реализации бутстрапа с их плюсами и минусами, а также расскажу об итоговом варианте, который мы выбрали для себя.

Читать далее
Всего голосов 8: ↑7 и ↓1+8
Комментарии2

Технологии искусственного интеллекта для военного назначения. Прогноз рынка до 2032 года

Уровень сложностиСредний
Время на прочтение27 мин
Количество просмотров2.7K

Всем привет! Я, Алексей Мартынов, продолжаю публиковать отраслевые исследования по применению технологий ИИ.

Ранее были опубликованы мои материалы:

Технологии ИИ: нет ничего искусственного в заботе о здоровье / Хабр (habr.com)

Искусственный интеллект в обрабатывающих производствах: инструмент форсирования технологической гонки / Хабр (habr.com)

В этой статье я исследую рынки, тренды и кейсы, игроков и эффекты, которые влияют на наше настоящее и формируют наше будущее в части военного назначения.

Читать далее
Всего голосов 13: ↑4 и ↓9-2
Комментарии10

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Анализ и моделирование футбольных результатов английской Премьер-лиги с использованием методов машинного обучения

Уровень сложностиСложный
Время на прочтение29 мин
Количество просмотров1.5K

Рассмотрим статью 2018 года наших индийских коллег Rahul Baboota и Harleen Kaur «Predictive analysis and modelling football results using machine learning approach for English Premier League». Особое внимание советую уделить отбору признаков (feature engineering) — возможно, у вас появятся собственные новые идеи в этой области. Также рекомендую сравнить результаты различных моделей (naive Bayes, SVM, Random Forest, XGBoost) с вашими собственными.

Читать далее
Всего голосов 6: ↑4 и ↓2+7
Комментарии2

Качество мобильных сетей на курортах: Связь есть, но есть нюансы

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2K

Аналитики Vigo рассмотрели качество на основных курортах юга России и выявили основные проблемы, влияющие на качество пользовательского опыта абонентов мобильных сетей во время высокого сезона. На Крымском полуострове основная деградация из‑за качества транспортных сетей, а на курортах Краснодарского края наблюдается нехватка емкости радиосетей...

Читать далее
Всего голосов 7: ↑4 и ↓3+5
Комментарии13

Изучение статистических закономерностей на примере измерения фона космического излучения

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров697

Цель работы: на примере статистики регистрации фоновых космических частиц изучить статистические закономерности однородного во времени случайного процесса; проверить возможность описания исследуемого процесса статистическими законами Пуассона и Гаусса; измерить среднее число регистрируемых космических лучей в секунду и определить погрешность результата.

Оборудование: счётчик Гейгера—Мюллера, компьютер с интерфейсом для связи со счётчиком, расчётная программа.

Читать далее
Всего голосов 3: ↑1 и ↓2+1
Комментарии3

Как проиграть войну и увеличить риск анафилактического шока. Тирания KPI

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров4.6K

Как у всех появилась зацикленность на количественных показателях? Почему даже ошибочным цифрам верят больше, чем суждениям профессионалов?

Читать далее
Всего голосов 36: ↑33 и ↓3+31
Комментарии19

Правда ли, что в России самые «богатые» программисты? И как с этим в других странах

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров28K

В России настоящий фетиш на программистов. Жены айтишников — отдельный жанр в запрещенных социальных сетях, на офисы крупных технологических компаний снимают обзоры, государство раздаёт разработчикам плюшки покруче, чем социально незащищённым категориям граждан. И тут закономерно возникает вопрос, а это только у нас так?

попробуем разобраться
Всего голосов 41: ↑29 и ↓12+26
Комментарии132

Дашборд как инструмент взаимодействия с бизнесом

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.5K

Всем привет! Сегодня поговорим про дашборды — что это за инструмент такой и как с помощью него взаимодействовать с бизнесом.

Меня зовут Дарья Еськова, я аналитик данных в компании билайн. Если быть точнее, то в команде CLTV, лидирую направление автоматизации визуализации данных. Хочу поделиться с вами своим опытом и наработками. 

Поговорим в основном про дашборды с точки зрения бизнеса. Есть технические дашборды, но акцент в посте будет на бизнес-дашбордах — на тех, которые смотрят наши руководители, менеджеры, бизнес-юниты.

Исходно дашбордом называли доску между кучером и лошадью, которая служила преградой для летящей из-под копыт грязи. Но, понятное дело, сейчас мы пользуемся этим словом совершенно для другого. Это информационная панель, которая отображает наши метрики. Как раз этот инструмент, который позволяет донести нужные цифры в нужное время для нужных людей.

Например, наш аналитик, я, кто-то из вас может сказать, что наши продажи выросли, и будет здорово, если бизнесу такой информации достаточно. Но зачастую происходит так, что бизнес просит подтвердить эти факты какими-то данными, которым мы доверяем. И вот как раз визуализация — это очень удобный инструмент, это интерфейс доступа к данным.

Читать далее
Всего голосов 14: ↑11 и ↓3+15
Комментарии4

Проектируем А/Б-эксперименты грамотно

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров4.2K

Проектирование A/B-экспериментов может быть сложным процессом, особенно для тех, кто только начинает работать с аналитикой и тестированием в мобильных приложениях. Нередко возникают проблемы с формулировкой гипотез, выбором метрик и определением оптимального распределения аудитории.

На связи Алексей Андриянов, менеджер продукта в RuStore. В этой статье на простом примере мы рассмотрим, как правильно подойти к постановке гипотезы и избежать распространенных ошибок при тестировании изменений в мобильных приложениях.

Читать далее
Всего голосов 18: ↑16 и ↓2+24
Комментарии3
1
23 ...