Плохие новости для тех, кто думает что «поймал Бога за бороду» выбрав в качестве профессии одну из ИТ специальностей. Индекс HH.ru для профобласти ИТ впервые держится выше значения 8 второй месяц подряд.
Статистика в IT
Статистика, исследования, тенденции
Новости
Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение
В прошлой части мы с вами остановились на том, что обнаружили у временного ряда с температурой две сезонности и, несмотря на это, решили двигаться дальше в выполнении сезонной модели САРПСС по методологии АРПСС. В этой части второй главы мы с вами продолжим применение методологии для поиска оптимальных параметров модели, которая будет адекватно описывать целевой временной ряд с температурой.
Необычные вкусы покупателей: что такое товарные пары и как их исследовать
Привет, Хабр! На связи команда продуктовой аналитики.
Подбор и обновление ассортимента товаров — постоянная головная боль для любого ритейлера. Это трудоемкий процесс, где каждая ошибка стоит реальных денег. В ecom.tech мы стараемся сделать его проще при помощи автоматизации, а заодно изучаем предпочтения покупателей. На этот раз мы искали, что обычно покупают в паре – так называемые комплементарные товары.
В этой статье расскажем:
- с чем обычно покупают лапшу быстрого приготовления, а с чем — детское питание;
- как география, время суток и другие факторы влияют на выбор покупателей;
- как все эти полученные знания можно применить в ассортиментных матрицах дарксторов и бизнес-процессах ритейла.
Вытеснит ли искусственный интеллект людей из мастеринга?
Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ.
Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.
Истории
CISQ. Исследование анализа качества ПО 2020 — часть 1
Консорциум по качеству информации и программного обеспечения (CISQ) запустил опрос «Состояние отрасли» - первое комплексное исследование анализа качества программного обеспечения. В этой статье перевод части результатов опроса - раздела "Инженерия". Во второй части будет перевод оставшихся двух разделов - "Системные интеграторы", "Управление поставщиками".
Cтатистика Байеса в ML для самых маленьких
Пожалуй, одна из важнейших тем для подготовки крутых специалистов машинного обучения. Ведь закономерности всегда подлежат какой-то аналитике с точки зрения вероятностей. А как иначе?
🔜 Как вы будете рекомендовать девушек в анкетах знакомств, если не вычислите статистическую вероятность симпатии от огонечков на шести сторисах?
🔜 Как вы будете подсчитывать успех кражи внутренних данных компании в обход NDA?
🔜 Может ограбить банк не такая уж плохая идея с вашими вводными данными?
Байес — это палочка-выручалочка.
По статистике 90% мужчин и девушек, что знают метод МСМС, лучше пахнут и получают на 100% больше взаимных симпатий.
Хотите также? — читайте нашу статью по Байесовской статистике в ML для самых маленьких.
Последовательное A/B-тестирование в Netflix. Часть 2: процессы подсчёта
Сталкивались вы когда-нибудь с ошибкой при просмотре потокового видео на Netflix? Может — неожиданно останавливался или вовсе не запускался фильм, который вас заинтересовал? В первой части этой серии статей мы рассказали о методологии тестирования канареечных релизов, применяемой к показателям, которые представлены непрерывными потоками данных. Среди таких показателей — «задержка воспроизведения» (play‑delay). Вот комментарий одного из читателей:
«А что если выход нового релиза не связан с изменениями в функционале воспроизведения и потоковой передачи видео? Например — что если в новом релизе будет изменено что-то, ответственное за вход пользователя в систему? Тестируя такой релиз вы, как и в других случаях, так же будете наблюдать за метрикой «задержка воспроизведения»?»
Как пакет с пакетами помог аналитику решить задачу для бизнеса, или keep calm and import statsmodels
Всем привет!
Меня зовут Сабина, я лидер команды исследователей данных во ВкусВилле. Мы помогаем бизнесу принимать решения, ориентируясь в том числе на данные.
Сегодня я расскажу об одном таком случае. Статья будет полезна аналитикам, которые хотят перестать беспокоиться и начать использовать линейную регрессию из питоновской библиотеки stasmodels.
Анализ вакансий ИТ в Москве: системное администрирование, 2024г
Прошел еще один год и снова появилась необходимость актуализировать и проанализировать данные по предложениям работы в сфере системного администрирования для дальнейшего планирования заработных плат специалистам уже на 2025 год.
В этот раз мы дополнительно сравним результаты со значениями проведенного анализа в 2022 и 2023 годах.
Цели, условия, методика и формат анализа остались без изменений, их можно прочитать в предыдущих статьях или спойлером ниже. Данные по каждой должности сравним с предыдущими периодами по количеству вакансий и по заработным платам.
Удаленка под угрозой: зарубежные компании возвращают людей в офисы. Почему это неизбежно затронет Россию?
Иногда кажется, что удаленка была с нами всегда. Хотя массово айтишники начали работать из дома лишь с 2020 года из-за пандемии COVID-19. Тогда говорили, что это временная мера и уже через месяц все вернутся в офис.
Прошло 4 года, пик удаленки позади – работодатели начинают возвращать людей в офисы. Последние, конечно, сопротивляются. Рассказываем, чем мировому бигтеху не угодила удаленка, зачем российские компании стараются заманить людей обратно в офисы и почему удаленка оказалось под угрозой исчезновения.
Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат
Предиктивная аналитика в промышленности: путь к повышению эффективности и снижению затрат
Предиктивная аналитика кардинально меняет подход к обслуживанию и управлению промышленным оборудованием. В условиях цифровой трансформации бизнеса, особенно в производственном секторе, она становится незаменимым элементом для повышения эффективности, минимизации простоев и снижения затрат. Рассмотрим, как предиктивная аналитика помогает промышленным компаниям достигать стратегических целей и что важно учитывать при её внедрении.
Бутстрап в PySpark
Всем привет! Меня зовут Илья Черников, я аналитик больших данных в X5 Tech, сейчас занимаюсь аналитикой и оценкой активностей CVM маркетинга экспресс-доставки “Пятёрочки”.
В статье я расскажу о том, как мы решали вопрос автоматизации оценки эффективности большого количества маркетинговых кампаний с помощью бутстрапа в PySpark. Я опишу различные подходы к реализации бутстрапа с их плюсами и минусами, а также расскажу об итоговом варианте, который мы выбрали для себя.
Технологии искусственного интеллекта для военного назначения. Прогноз рынка до 2032 года
Всем привет! Я, Алексей Мартынов, продолжаю публиковать отраслевые исследования по применению технологий ИИ.
Ранее были опубликованы мои материалы:
Технологии ИИ: нет ничего искусственного в заботе о здоровье / Хабр (habr.com)
В этой статье я исследую рынки, тренды и кейсы, игроков и эффекты, которые влияют на наше настоящее и формируют наше будущее в части военного назначения.
Ближайшие события
Анализ и моделирование футбольных результатов английской Премьер-лиги с использованием методов машинного обучения
Рассмотрим статью 2018 года наших индийских коллег Rahul Baboota и Harleen Kaur «Predictive analysis and modelling football results using machine learning approach for English Premier League». Особое внимание советую уделить отбору признаков (feature engineering) — возможно, у вас появятся собственные новые идеи в этой области. Также рекомендую сравнить результаты различных моделей (naive Bayes, SVM, Random Forest, XGBoost) с вашими собственными.
Качество мобильных сетей на курортах: Связь есть, но есть нюансы
Аналитики Vigo рассмотрели качество на основных курортах юга России и выявили основные проблемы, влияющие на качество пользовательского опыта абонентов мобильных сетей во время высокого сезона. На Крымском полуострове основная деградация из‑за качества транспортных сетей, а на курортах Краснодарского края наблюдается нехватка емкости радиосетей...
Изучение статистических закономерностей на примере измерения фона космического излучения
Цель работы: на примере статистики регистрации фоновых космических частиц изучить статистические закономерности однородного во времени случайного процесса; проверить возможность описания исследуемого процесса статистическими законами Пуассона и Гаусса; измерить среднее число регистрируемых космических лучей в секунду и определить погрешность результата.
Оборудование: счётчик Гейгера—Мюллера, компьютер с интерфейсом для связи со счётчиком, расчётная программа.
Как проиграть войну и увеличить риск анафилактического шока. Тирания KPI
Как у всех появилась зацикленность на количественных показателях? Почему даже ошибочным цифрам верят больше, чем суждениям профессионалов?
Правда ли, что в России самые «богатые» программисты? И как с этим в других странах
В России настоящий фетиш на программистов. Жены айтишников — отдельный жанр в запрещенных социальных сетях, на офисы крупных технологических компаний снимают обзоры, государство раздаёт разработчикам плюшки покруче, чем социально незащищённым категориям граждан. И тут закономерно возникает вопрос, а это только у нас так?
Дашборд как инструмент взаимодействия с бизнесом
Всем привет! Сегодня поговорим про дашборды — что это за инструмент такой и как с помощью него взаимодействовать с бизнесом.
Меня зовут Дарья Еськова, я аналитик данных в компании билайн. Если быть точнее, то в команде CLTV, лидирую направление автоматизации визуализации данных. Хочу поделиться с вами своим опытом и наработками.
Поговорим в основном про дашборды с точки зрения бизнеса. Есть технические дашборды, но акцент в посте будет на бизнес-дашбордах — на тех, которые смотрят наши руководители, менеджеры, бизнес-юниты.
Исходно дашбордом называли доску между кучером и лошадью, которая служила преградой для летящей из-под копыт грязи. Но, понятное дело, сейчас мы пользуемся этим словом совершенно для другого. Это информационная панель, которая отображает наши метрики. Как раз этот инструмент, который позволяет донести нужные цифры в нужное время для нужных людей.
Например, наш аналитик, я, кто-то из вас может сказать, что наши продажи выросли, и будет здорово, если бизнесу такой информации достаточно. Но зачастую происходит так, что бизнес просит подтвердить эти факты какими-то данными, которым мы доверяем. И вот как раз визуализация — это очень удобный инструмент, это интерфейс доступа к данным.
Проектируем А/Б-эксперименты грамотно
Проектирование A/B-экспериментов может быть сложным процессом, особенно для тех, кто только начинает работать с аналитикой и тестированием в мобильных приложениях. Нередко возникают проблемы с формулировкой гипотез, выбором метрик и определением оптимального распределения аудитории.
На связи Алексей Андриянов, менеджер продукта в RuStore. В этой статье на простом примере мы рассмотрим, как правильно подойти к постановке гипотезы и избежать распространенных ошибок при тестировании изменений в мобильных приложениях.
Вклад авторов
alizar 1438.5DmitrySpb79 681.0marks 435.63Dvideo 398.0VaskivskyiYe 380.0ilusha_sergeevich 331.0ancotir 279.6voodee 276.0tyomitch 275.0