X5 Tech - Всё о технологиях в ритейле / Статьи / Хабр

Как стать автором

ПрофильСтатьи214Посты3Новости87Вакансии2

Mixiw 25 июл в 08:08

Как мы делали персонализированные баннеры с помощью ИИ

Простой

3 мин

1.2K

Блог компании X5 TechМедийная реклама * Искусственный интеллектIT-компании

Кейс

Привет, Хабр!

Я — Михаил Су воров, технический менеджер продуктов искусственного интеллекта.
В статье я расскажу про наш кейс создания персонализированных баннеров с помощью ИИ.

Читать далее

+4

nnazarov 10 июл в 09:12

Проблема подглядывания и последовательное А/Б тестирование

12 мин

2.4K

Блог компании X5 TechPython * Математика * Статистика в IT

Хабр, привет! Сегодня узнаем, что такое проблема подглядывания и почему она появляется. Реализуем аналог метода Покока и критерий Вальда для последовательного тестирования. Посмотрим, можно ли одновременно подглядывать и контролировать вероятности ошибок при том же размере групп. Обсудим границы применимости последовательного тестирования.

Читать далее

+9

AlDemidov 9 июн в 11:54

Как автоматизировать создание CJM с помощью ИИ?

Простой

7 мин

6.1K

Блог компании X5 TechIT-компанииИскусственный интеллектКлиентская оптимизация *

Меня зовут Александр Демидов, я бизнес-аналитик в X5 Tech. В этой статье я постараюсь по существу рассказать как я полюбил создавать карты клиентского пути (CJM), что помогло мне делать их в 4 раза быстрее и почему искусственный интеллект настоящая палочка-выручалочка при верном подходе.

Читать далее

+9

VasiliyS178 22 мая в 13:18

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2

Простой

13 мин

3.1K

Блог компании X5 TechPython * Алгоритмы * Хранение данных * Data Engineering *

Туториал

Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в Х5 Tech, успел за это время познакомиться с несколькими интересными проектами и подходами в области обработки данных, об одном из которых пойдет речь далее.

В этой статье расскажу о том, как можно повысить эффективность хранения данных за счет уменьшения их дублирования.

Разберем, что из себя представляют Slowly Changing Dimensions-2 (далее SCD-2) таблицы и самостоятельно реализуем на PySpark алгоритм сохранения данных в них. Попутно поговорим о том, как находить изменения в любой таблице, даже если отсутствуют поля для выбора изменившихся записей, и научимся получать из созданной SCD-2 таблицы срезы на требуемую дату в прошлом.

Читать далее

+5

nnazarov 11 апр в 12:23

Мифы о байесовском А/Б тестировании

11 мин

6K

Блог компании X5 TechPython * Математика * Статистика в IT

Хабр, привет! Сегодня сравним два подхода к А/Б тестированию: байесовский и частотный. Обсудим сложности в интерпретации p-value. Посмотрим, как можно учитывать дополнительную информацию через априорное распределение. Остановим тест раньше времени и решим проблему подглядывания.

Читать далее

+10

smatrosov 3 апр в 11:04

Welch's test: он вам не замена Т-test'a

Средний

30 мин

2.7K

Блог компании X5 TechСтатистика в ITАналитика мобильных приложений * IT-компанииВеб-аналитика *

Туториал

Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

Читать далее

+5

gofat 18 мар в 07:35

Разметка данных с использованием LLM

12 мин

6.1K

Блог компании X5 TechNatural Language Processing * Искусственный интеллектМашинное обучение * IT-компании

Всем привет! Меня зовут Артем Ерохин. Я работаю в X5 Tech в направлении продуктивизации ИИ. В прошлом году у меня был доклад про разметку данных с LLM. И я решил преобразовать этот доклад в статью, попутно обновив некоторые цифры и тезисы (такова уж скорость прогресса в этой области).

Читать далее

+15

AGumenyuk777 10 мар в 09:21

Как я стал ментором: опыт, уроки, шаблоны

8 мин

2.6K

Блог компании X5 TechКарьера в IT-индустрииIT-компанииУправление персоналом *

Кейс

Привет, Хабр! Меня зовут Александр Гуменюк, я менеджер центра компетенций бизнес-аналитиков в X5 Tech. В 2016 году я пришел в IT-отдел торговой сети «Перекрёсток» в роли бизнес-аналитика. Первые полгода прошли под девизом: «Ничего не понятно, но очень интересно!». А сегодня я уже шестой год руковожу командами бизнес-аналитиков. За это время я прошёл путь от менти до ментора — и понял, что менторство может здорово прокачать не только людей, но и бизнес.

Почему это важно? В ритейле, где я работаю, всё меняется молниеносно: процессы, данные, люди. Без поддержки опытных коллег «новички» тонут, а «старички» выгорают. Менторство помогает расти быстрее, чувствовать себя увереннее и не бояться ошибок. В статье я расскажу, как сам стал ментором, какие подходы выстроил и что это дало моей команде. Будут реальные кейсы, мой шаблон для менторских сессий и набор инструментов, которые вы сможете взять и попробовать.

Читать далее

+7

Mixailkys 24 фев в 14:44

Искусственный интеллект в ритейле: как он предсказывает вашу следующую покупку в приложении

Средний

9 мин

3.5K

Блог компании X5 TechМашинное обучение * Математика * Искусственный интеллектIT-компании

Обзор

Привет, Хабр! На связи подразделение ad-hoc аналитики X5 Tech. Сегодня мы расскажем о задаче Next Basket Recommendation (NBR) и о том, как она может быть полезна для онлайн-ритейла. В этой статье мы рассмотрим, как с помощью рекомендательных моделей можно предсказать, какие товары пользователь добавит в свою следующую корзину, и как это помогает улучшить взаимодействие с приложением. Вы узнаете о ключевых метриках, которые используются для оценки качества рекомендаций, а также познакомитесь с различными подходами — от простых частотных методов до современных моделей на основе глубокого обучения.

Читать далее

+13

Impossiblenickname 14 фев в 07:00

Как проектировать скелетоны

11 мин

7K

Блог компании X5 TechДизайнИнтерфейсы * Читальный залУправление разработкой *

Обзор

✏️ Технотекст 7

Хабр, привет, это снова я! Меня зовут Антон, я дизайнер b2b продуктов в X5 Tech. Мне нравится моя работа и я стараюсь проектировать реализуемые интерфейсы, поэтому постоянно закапываюсь в технические нюансы.

Какое‑то время назад я писал статью про загрузочные экраны и там коротко рассматривал скелетоны, но делал это не настолько подробно, насколько хотелось бы. Тема богатая, сложная и простая одновременно, надеюсь, понравится. Запасайтесь любопытством, а я, в свою очередь, поделюсь опытом в проектировании скелетонов.

Научиться

+19

EgorovM 7 фев в 07:16

Построение инфраструктуры для работы с языковыми моделями: опыт X5 Tech

4 мин

2.4K

Блог компании X5 TechIT-компанииИскусственный интеллектIT-инфраструктура *

✏️ Технотекст 7

Привет, Хабр! Я Мичил Егоров, руководитель команды разработки продуктов искусственного интеллекта в X5 Tech. В последнее время языковые модели (LLM) стали неотъемлемой частью многих бизнес-процессов, начиная от чат-ботов и заканчивая автоматической обработкой отзывов клиентов. Однако, чтобы эффективно использовать такие модели, необходима мощная и гибкая инфраструктура.

За последний год команда X5 Tech значительно выросла, проверила множество гипотез и протестировала различные модели. Основные кейсы использования включают чат-боты, суфлёры для модераторов, автоматическое резюмирование и обработку отзывов клиентов. В этой статье расскажу, как команда X5 Tech построила инфраструктуру для работы с языковыми моделями, какие вызовы преодолели и какие решения были приняты.

Читать далее

+11

nnazarov 31 янв в 11:42

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

9 мин

2.4K

Блог компании X5 TechПрограммирование * Искусственный интеллектData Mining * Машинное обучение *

✏️ Технотекст 7

Хабр, привет! Меня зовут Николай Назаров, я работаю аналитиком данных в X5 Tech. Недавно завершился чемпионат по программированию Yandex Cup ML Challenge 2024, в котором я занял второе место в задаче “Self-driving cars: предсказание движения беспилотного автомобиля”. В статье расскажу про задачу и подходы, которые использовал для решения.

Читать далее

+11

allendorf 23 янв в 10:28

Как навести порядок в Figma и уменьшить ошибки на дизайн-ревью

5 мин

5.2K

Блог компании X5 TechIT-компанииИнтерфейсы * ДизайнУправление проектами *

Туториал

✏️ Технотекст 7

Всем привет, меня зовут Илья Аллендорф, я занимаюсь дизайном внутреннего продукта в X5 Tech. В статье расскажу, как я улучшил подготовку макетов для разработки и навёл порядок в рабочем проекте в Figma.

В 2023 году я пришёл в новый продукт, который разрабатывался с нуля. За два года мы запустили MVP, перевели бизнес-процесс в продукт, достигли целевых метрик, а ещё совершили ошибки и сделали ценные выводы. Кроме того, мы ускорили сycle time, улучшив взаимодействие с дизайном: навели порядок в Figma, договорились с аналитиками, упростили жизнь разработке и уменьшили этап дизайн-ревью.

Теперь обо всём по порядку

+12

Vadim_Sorokin 16 янв в 13:08

Эконометрика в ритейле: как не потратить миллионы на заведомо неэффективные эксперименты

13 мин

3.1K

Блог компании X5 TechСтатистика в ITМатематика * Python * Big Data *

Всем привет! На связи команда ad-hoc аналитики X5 Tech. Если вы уже знакомы с нашими статьями, то наверняка знаете, что нашей ключевой темой является А/Б тестирование. Важной составляющей А/Б теста является дизайн: для успешного проведения эксперимента необходимо оценить размер пилотной и контрольной групп, зафиксировав предварительно ожидаемый эффект. Но возникает вопрос: как убедиться в обоснованности гипотезы и рассчитать ожидаемые эффекты от инициативы?

В статье мы рассмотрим ключевые понятия из эконометрики, такие как коинтеграция и модель коррекции ошибок, и продемонстрируем их применение на ретроспективных данных. Мы подробно разберём, как использовать эти инструменты для анализа взаимосвязей между временными рядами. В качестве практического примера с помощью функции импульсного отклика мы проведём количественную оценку ожидаемого влияния повышения комплектности персонала на списания на выбранном кейсе.

Читать далее

+3

muxeu 28 дек 2024 в 09:06

Контекстные бандиты в ценообразовании

Средний

12 мин

2.5K

Блог компании X5 TechМашинное обучение * Алгоритмы * Математика *

Обзор

Всем привет! На связи команда аналитиков X5 Tech. Мы продолжаем исследовать подходы Reinforcement Learning для ценообразования. В этой статье мы рассмотрим применение контекстных многоруких бандитов на примере модельной задачи, опишем несколько реализаций и сравним их.

Читать далее

+3

mayo889 27 дек 2024 в 09:16

Temporal Fusion Transformer: улучшение прогнозирования в ритейле с минимальными затратами

24 мин

5.9K

Блог компании X5 TechМашинное обучение * Python * Big Data * IT-компании

Туториал

Всем привет! Меня зовут Дмитрий Поляков, я работаю аналитиком данных в команде ad-hoc аналитики X5 Tech. В этой статье мы хотели бы рассмотреть задачу прогнозирования, которая является чрезвычайно важной задачей в ритейле.

Мы детально рассмотрим основные преимущества и архитектурные особенности модели Temporal Fusion Transformer (TFT), наш подход к использованию этой модели в задаче прогнозирования спроса, и как нам удалось увеличить точность прогнозов в среднем на 7%, затратив при этом минимальные усилия.

Также эта статья будет полезна и тем, кто хочет глубже понять принципы работы TFT, изучить её применение в библиотеке Darts и решить задачу прогнозирования для множества многомерных временных рядов.

Читать далее

+6

Lesnoy_otz 18 дек 2024 в 13:47

Diff-in-diff: жизнь за пределами идеального эксперимента

17 мин

4.8K

Блог компании X5 TechМатематика * Статистика в ITIT-компании

✏️ Технотекст 7

Привет, Хабр! На связи команда ad-hoc аналитики X5 Tech.

Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). В этой статье мы обсудим, что такое идеальный эксперимент и почему он позволяет корректно оценить эффект от воздействия. Затем расскажем, когда идеальный эксперимент невозможен и дадим интуитивное обоснование того, как метод difference-in-difference помогает справиться с оценкой эффекта воздействия в таких ситуациях. В конце мы обсудим формальные предпосылки метода и покажем на примере симуляций последствия их невыполнения.

Читать далее

+3

Maria_Ibragimova 13 дек 2024 в 08:52

Как гуманитарию подойти к IT: из переводчика в технические писатели

7 мин

2K

Блог компании X5 TechIT-компанииПодготовка технической документации * Карьера в IT-индустрии

Всем привет! Меня зовут Мария Ибрагимова, я технический писатель в X5 Tech. Но так было не всегда. Ещё каких-то 4 года назад я работала в проектном институте с устрашающим названием ЛЕННИИХИММАШ и не представляла себя в сфере информационных технологий. Хочу поделиться своим опытом, как мне удалось подойти к IT.

Читать далее

+14

aleksakirik 11 дек 2024 в 09:10

Повышение производительности складской комплектации: как без трудоёмкого хронометража найти потенциал ускорения

6 мин

2K

Блог компании X5 TechBig Data * Управление проектами * Управление персоналом * Статистика в IT

Кейс

✏️ Технотекст 7

Текущая экономическая ситуация в мире приводит к сильному давлению роста цен во всех секторах экономики. Ритейлеры не могут перекладывать эти риски на плечи своих покупателей, что приводит их к необходимости поиска новых путей сокращения затрат на экземпляр процесса, т. е. на штуку товара. Усиливающаяся конкуренция с e‑commerce требует перестройки процессов и выхода на повышенные скорости доставки в борьбе за клиента.

И кажется, что все имеющиеся инструменты повышения эффективности уже использованы. Но есть ещё один. В этой статье я расскажу о нашем опыте повышения производительности операций в распределительных центрах торговой сети «Пятёрочка» без больших финансовых вливаний и долгосрочных разработок. Я руковожу Департаментом развития аналитики «Цепочки поставок и поддерживающие функции» в Х5 Tech, и моя команда занимается поиском путей повышения эффективности бизнеса через анализ больших данных.

Читать далее

+13

dmitry_syubaev 6 дек 2024 в 09:24

Пишем сервис инференса ML-модели на go, на примере BERT-а

7 мин

3.4K

Блог компании X5 TechМашинное обучение * Python * Go *

Туториал

Привет, на связи команда аналитиков Х5 Tech. В статье пишем сервис инференс ML-NLP модели на go. Допустим, вам нужно внедрить ML-модель (разработанную/обученную на Рython-фреймворке) в сервис в вашей инфраструктуре. По какой-то причине (не важно какой) этот сервис должен быть на golang-е. Здесь покажем, как это можно сделать, используя ONNX.

Если вы это читаете, то, вероятно, или вы знакомы с обучением ML-моделей на Рython, библиотекой моделей huggingface, языковыми моделями BERT, или вы являетесь бэкенд разработчиком на golang.

В качестве примера будем использовать модель из библиотеки huggingface seara/rubert-tiny2-russian-sentiment, которая классифицирует сантимент текста.

Читать далее

+11

1

2 3 ...