Все потоки

Статистика в IT

Статистика, исследования, тенденции

СтатьиПостыНовостиАвторыКомпании

aleksakirik 11 дек 2024 в 09:10

Повышение производительности складской комплектации: как без трудоёмкого хронометража найти потенциал ускорения

6 мин

2.2K

Блог компании X5 TechУправление персоналом * Управление проектами * Big Data * Статистика в IT

Кейс

✏️ Технотекст 7

Текущая экономическая ситуация в мире приводит к сильному давлению роста цен во всех секторах экономики. Ритейлеры не могут перекладывать эти риски на плечи своих покупателей, что приводит их к необходимости поиска новых путей сокращения затрат на экземпляр процесса, т. е. на штуку товара. Усиливающаяся конкуренция с e‑commerce требует перестройки процессов и выхода на повышенные скорости доставки в борьбе за клиента.

И кажется, что все имеющиеся инструменты повышения эффективности уже использованы. Но есть ещё один. В этой статье я расскажу о нашем опыте повышения производительности операций в распределительных центрах торговой сети «Пятёрочка» без больших финансовых вливаний и долгосрочных разработок. Я руковожу Департаментом развития аналитики «Цепочки поставок и поддерживающие функции» в Х5 Tech, и моя команда занимается поиском путей повышения эффективности бизнеса через анализ больших данных.

Читать далее

+13

breakingtesting 10 дек 2024 в 22:48

Знай своего ментора

Простой

2 мин

1.6K

Тестирование IT-систем * Исследования и прогнозы в IT * Статистика в ITКарьера в IT-индустрииУчебный процесс в IT

Аналитика

Поскольку в последнее время часто вижу рекламу “войти в IT”, решил посмотреть и дать картину того, кто выступает в качестве менторов и стоит ли им доверять на примере наставников в тестирование.

Читать далее

+2

Nina_Feshchenko 9 дек 2024 в 17:19

Прогнозирование продаж с использованием библиотеки Prophet, часть 2

Средний

5 мин

7.2K

Блог компании билайнBig Data * Статистика в ITМашинное обучение *

Туториал

Привет! Продолжаю знакомить вас с библиотекой Prophet в качестве инстурмента прогнозирования продаж. Первая часть тут.

Функции для критериев качества в нашей прогнозной модели будут выглядеть следующим образом:

Читать далее

+14

aleksei_terentev 8 дек 2024 в 06:20

Метрики оценки качества вероятностей в бинарной классификации: опыт из ФинТеха

Средний

14 мин

9.9K

Машинное обучение * Python * Финансы в ITСтатистика в ITData Mining *

Из песочницы

Бинарная классификация — одна из ключевых задач машинного обучения, но в реальных приложениях часто важно не только определить класс, но и понять, с какой вероятностью модель принимает решение. Как проверить точность вероятностных предсказаний?

В статье обсуждаются специализированные инструменты для оценки качества вероятностных прогнозов, ключевые метрики и их интерпретация. Материал будет полезен для практиков, стремящихся повысить точность и объяснимость своих моделей.

Читать далее

+8

ilya_undertakes 5 дек 2024 в 10:15

Как технарю и не только проверить блогера в телеграме на накрутку?

Простой

5 мин

2.1K

Контекстная реклама * Медийная реклама * ИнфографикаСтатистика в IT

Из песочницы

Прочитай статью и узнай, как не потерять деньги при размещении рекламы у блогеров. Сегодня — проверка на накрутку.

Читать далее

+4

OlgaDS 5 дек 2024 в 06:17

В чём секрет сдачи экзаменов на 100/100? Оцениваем результаты эксперимента с помощью статистики на неполных данных

Простой

8 мин

2.4K

Блог компании Яндекс ПрактикумСтатистика в ITУчебный процесс в ITАнализ и проектирование систем *

Аналитика

Недавно YouTube подкинул мне видео «Я пообщался со 100 людьми, сдавшими ЕГЭ на 100, и вот что понял» — автор поговорил со ста выпускниками, сдавшими экзамен на высший балл, и обобщил их опыт. Многие советы из видео можно распространить не только на подготовку к экзамену, но и на подготовку к собеседованию или «вхождение в IT» — так что ролик будет интересен и тем, кто давно окончил школу.

Меня зовут Ольга Матушевич, я наставница на курсе «Аналитик данных» в Яндекс Практикуме. Как аналитик с профдеформацией я в любом подобном исследовании вижу недоделанный А/В-тест — и считаю своим долгом его доделать. В этом тексте я расскажу, какие результаты показал эксперимент из YouTube, и попробую выяснить, являются ли они статзначимыми.

Читать далее

+5

AntonSoroka 2 дек 2024 в 07:23

Что за распределение у выборочных квантилей?

Средний

6 мин

1.7K

Математика * Data Mining * Big Data * Python * Статистика в IT

Все знают про распределение выборочного среднего (его описывает Центральная предельная теорема), а что насчет выборочных квантилей?

В заметке я расскажу, как и зачем приближать распределения выборочных квантилей из данных с типичными распределениями: равномерное, экспоненциальное и нормальное, а также когда и какое приближение стоит использовать.

Читать далее

+3

BolshinDS 1 дек 2024 в 09:28

Как сравнивать ML-модели: шпаргалка для разработчиков и менеджеров

Средний

10 мин

3.5K

Блог компании t2Управление разработкой * Статистика в ITМашинное обучение *

Туториал

При разработке и поддержке ML-продуктов одним из ключевых решений является решение о переходе на новую модель, опережающую предыдущую по ряду характеристик. Разработчики и бизнес сталкиваются с риском впустую потратить ресурсы на продуктивизацию новой модели, если разница между текущей и обновленной моделью статистически не обоснована. В статье представлен исчерпывающий системный подход к разрешению данной дилеммы, который успешно применяется у нас в t2 (ранее Tele2).

Читать далее

+5

cappelchi 29 ноя 2024 в 11:25

Байесовская иерархическая модель для прогнозирования футбольных результатов

Сложный

13 мин

1.6K

Исследования и прогнозы в IT * Математика * Машинное обучение * Статистика в ITФинансы в IT

Перевод

Проблема моделирования футбольных данных становится все более популярной в последние несколько лет, и было предложено множество различных моделей с целью оценки характеристик, которые приводят команду к поражению или победе, или для прогнозирования счета конкретного матча. Рассмотрим байесовскую иерархическую модель и проверим ее прогнозирующие способности на основе данных о чемпионате Италии Серии А.

Читать далее

+6

smatrosov 29 ноя 2024 в 10:35

Гайд по мета-анализу результатов тестов

Средний

21 мин

3.6K

Блог компании X5 TechВеб-аналитика * Математика * Аналитика мобильных приложений * Статистика в IT

Туториал

✏️ Технотекст 7

Привет! На связи команда аналитиков «Пятёрочки» X5 Tech.

Подсчитать и проанализировать можно не только A/B, но также подвергнуть анализу ряд тестов с общей нулевой гипотезой. Другими словами, протестировать результаты серии тестов с классическим статистическим выводом о значимости показателей этой серии, то есть провести мета-анализ.

На написание этой статьи меня вдохновило общение внутри моей классной команды, общение с одним из аналитиком Gett, а также данный пост и комментарии к нему по поводу статьи Ebay.

Мета-анализ стоит на ступеньку выше по доказательности, чем обычный тест, так как аккумулирует информацию по ряду тестов. Можно сказать, что он проводит операцию слияния данных (data fusion), давая оценку оценкам, поэтому и мета. И раз он сильнее по доказательности, то и позволяет увереннее внедрять статистически значимые инициативы. Про это и поговорим в статье.

Читать далее

+9

Saygin 25 ноя 2024 в 15:58

Справочник статистических методов для менеджеров продукта и маркетологов

Простой

1 мин

5.6K

Статистика в ITУправление продуктом * Интернет-маркетинг * Growth Hacking *

Туториал

Давно замечаю, что подавляющее большинство менеджеров (продакты, маркетологи, growth-менеджеры) ограничиваются, в основном, одним статистическим методом — хи-квадратом (Chi-squared test) — что уже неплохо, но это только верхушка айсберга. Методов гораздо больше, и каждый из них может закрывать свои задачи.

Я долго искал, что могло бы стать готовым помощником для менеджеров, но ничего, что отвечало бы всем требованиям, так и не нашёл.

Поэтому собрал свой справочник с методами частотной аналитики. Старался сделать всё максимально просто: без формул, сложных терминов и заумных объяснений. Главное — чтобы было интуитивно понятно, какой метод выбрать и для какой задачи

Читать далее

+29

dezluvv 20 ноя 2024 в 13:51

Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

10 мин

1.5K

Статистика в ITМатематика * Python * Big Data *

Метод CUPED уже давно завоевал популярность в анализе A/B-тестов, предоставляя возможность выявлять эффекты меньших размеров. В этой статье мы подробно рассмотрим применение данного подхода на этапе дизайна эксперимента. Мы исследуем, как можно сократить размеры выборок, не теряя при этом в статистической мощности теста.

Читать далее

+1

volodya_research 20 ноя 2024 в 12:01

Считаем размер выборки для AB-теста на основе нормального распределения (готовимся к собеседованию на Аналитика)

Средний

7 мин

2.6K

Статистика в IT

Туториал

В этой статье мы рассмотрим ключевые аспекты расчета размера выборки для AB-тестирования, основанного на нормальном приближении. Я провожу вас через логическую цепочку планирования эксперимента, объясняя важные статистические концепции и формулы, необходимые для проведения AB-теста о равенстве средних значений численного признака. Эта информация будет особенно полезна для аналитиков, готовящихся к собеседованиям или стремящихся углубить свое понимание методологии экспериментов.⁠

Читать далее

+2

ptsecurity 20 ноя 2024 в 09:40

Атаки киберпреступников на Ближнем Востоке: итоги и прогнозы

9 мин

1K

Блог компании Positive TechnologiesСтатистика в ITИсследования и прогнозы в IT * Информационная безопасность *

Аналитика

Страны Ближнего Востока вслед за экономическим ростом переживают период цифровой трансформации. Сосредоточение большого количества финансов и расширение ИТ-инфраструктуры привлекают не только инвестиции, но и хакеров. Некоторые из них включаются в противостояние государств в регионе, другие ищут материальную выгоду — так или иначе киберпреступники представляют серьезную угрозу. Каковы цели злоумышленников, какие методы они используют и как страны Ближнего Востока пытаются сдерживать нарастающий поток атак — рассказываем в этой статье.

Читать далее

+4

dezluvv 16 ноя 2024 в 11:15

Увеличиваем размер выборки и прокрашиваем серые метрики: неочевидная ошибка при проведении А/B — тестов

Средний

10 мин

5.3K

Big Data * Python * Статистика в ITМатематика *

Из песочницы

Иногда мы настолько бываем увлечены способами увеличения мощности тестов, снижения дисперсии, уменьшения длительности теста, что забываем смотреть на данные при использовании стандартного критерия Стьюдента. В этой статье я постараюсь простым языком рассказать о последствиях, к которым может привести слепой запуск A/B-тестов без предварительного А/А-тестирования.

Читать далее

+8

Nina_Feshchenko 15 ноя 2024 в 12:00

Прогнозирование продаж с использованием библиотеки Prophet, часть 1

Средний

7 мин

3.4K

Блог компании билайнСтатистика в ITBig Data * Машинное обучение *

Туториал

Прогнозирование можно считать одной из основных задач аналитика. Прогноз продаж, оттока, выручки, затрат – всех основных KPI развития бизнеса – может потребоваться где и когда угодно, начиная от небольших ad hoc кейсов до масштабных задач вроде процесса бюджетирования на предстоящий год.

Меня зовут Нина Фещенко, я работаю в команде аналитики продаж FTTB-FMC (или иначе – ШПД и конвергентных продуктов) Билайн. В данной статье мы рассмотрим прогнозирование продаж FTTB-FMC для целей ежедневной отчетности.

Начнем с того, что мы понимаем под продажами ШПД и конвергенции.

Читать далее

+7

DeVfFuN 15 ноя 2024 в 08:15

Являются ли старение и смерть эволюционным преимуществом? Отвечает компьютерное моделирование

Средний

7 мин

6.2K

БиологияЭкологияСтатистика в ITПрограммирование * Научно-популярное

Из песочницы

Смертоносная эволюция: является ли программируемая смерть эволюционным преимуществом? Отвечает компьютерное моделирование.

Правдивая история о том, как я работал адвокатом для неприятной дамы с косой.

Из наблюдений за природой понятно, что смерть организмов от внутренних причин, таких как старение, является правилом, с небольшим количеством исключений. Полностью же бессмертными из многоклеточных признаны лишь семь(!) видов. И это из миллионов существующих. Почему это так?

Читать далее

+34

mr-pickles 11 ноя 2024 в 10:10

Обманчивая статистическая значимость

Простой

16 мин

7.5K

Блог компании Wunder FundМатематика * Статистика в IT

Перевод

Статистическая значимость похожа на автокафе научно‑исследовательского мира. Подъезжаешь к исследованию, забираешь свой «бургер значимости», и — бабах — у тебя в руках оказывается вкусный вывод, которым можно поделиться с друзьями. Применение показателей статистической значимости удобно не только с точки зрения читателей научных статей. Они облегчают жизнь и самим исследователям. Зачем долго и мучительно что‑то объяснять, когда можно вместо этого ограничиться парой простых слов?

Но не так всё просто.

Читать далее

+19

volodya_research 10 ноя 2024 в 22:02

Считаем доверительные интервалы для долей и медианы по нормальному распределению (готовимся к собесу на Аналитика)

Средний

5 мин

14K

Статистика в IT

Туториал

Недавно на выходном оффере в Авито спрашивали задачку про нахождение доверительного интервала для медианы. Эта статья появилась в результате моего резерча по этому вопросу.

В данной статье я напишу алгоритм рассчета доверительных интервалов для:
— Среднего значения
— Медианы (через нормальную аппроксимацию к биномиальному распределению)
— Доли (через нормальную аппроксимацию к биномиальному распределению)

Основным научным результатом публикации является всепроникаемость нормального распределения и возможность оценить с его помощью что угодно. В задаче про нахождение доверительного интервала для медианы, нормальное распределение дало такую элегантную формулу, содержащую только корень из размера выборки, что я до сих пор не могу перестать удивляться.

Читать далее

+8

MsRedlLynx 8 ноя 2024 в 11:57

Когда релиз? Как мы оптимизировали процессы с помощью метрик

Средний

6 мин

8K

Блог компании Точка БанкСтатистика в ITIT-компанииУправление персоналом * Управление разработкой *

Работать комфортно, эффективно и не тратить время на бесполезные задачи — к этому стремится любая команда. Но ситуации, когда люди вроде бы работают, а релиза всё нет, случаются регулярно.

Меня зовут Полина Таран, и уже три года я работаю тимлидом в финтех-компании Точка. Мы решили разобраться, почему действия не дают желаемого результата, а некоторые задачи неделями висит в режиме ожидания. Найти и устранить причину нам помогли метрики — подробности под катом.

Читать далее

+23

1 2 ...

8

9 10 ...