Хабр

Все потоки

СтатьиПостыНовостиАвторыКомпании

Rombneromb 12 дек 2025 в 09:46

Правда ли, что ICPC работает как социальный лифт в IT-карьере

9 мин

9.2K

Блог компании X5 TechАлгоритмы * ХакатоныКарьера в IT-индустрииПрограммирование *

Мнение

Привет, Хабр! Я давно отучился в школе и институте, но хорошо помню, как мне говорили: «Учи! Тебе это пригодится! Без этого никуда! Это очень важно…» и почти никогда не объясняли, зачем учить, когда это пригодится и для чего.

Поэтому, когда мне поставили задачу написать про полуфинал Международной студенческой олимпиады по программированию (ICPC) для региона «Северная Евразия», я решил не пересказывать данные из Википедии. Вы и сами можете их прочитать, а кто-то даже рассказать о собственном опыте участия. Я спросил коллег внутри X5 Tech, как навыки, полученные на соревнованиях по программированию помогли им в реальной жизни: на собеседованиях, в продакшене, в решении сложных системных задач или даже в бытовых ситуациях. Про то, что спортивное программирование развивает алгоритмическое мышление, стрессоустойчивость и умение работать в команде в ограниченное время, пишут много, но теория не всегда переносится на практику.

Так как же обстоят дела на самом деле? Какие алгоритмические привычки пятичасовых контестов переходят в инженерную практику? И помогают ли навыки с олимпиад, когда сталкиваешься с реальным сервисом, данными и нагрузками, а не с абстрактными задачами?

Читать далее

+5

gofat 10 дек 2025 в 09:37

Проксируй это: как ускорить A/B-тесты и не попасть в ловушку метрик

13 мин

5.8K

Блог компании X5 TechData Engineering * Управление продуктом * Тестирование IT-систем * Математика *

В A/B-тестах хотелось бы смотреть на главную метрику, ту самую North Star, которая показывает успех продукта. Но на практике она почти всегда медленная, шумная и бесполезная для быстрых решений. Например, вы запускаете тест новой системы рекомендаций, ждёте неделю, две, а LifeTime Value не двигается. И непонятно, это потому что нет результата или ещё рано делать выводы.

Чтобы не тратить месяцы на догадки, можно воспользоваться прокси-метриками — быстрыми, чувствительными показателями, которые реагируют раньше, чем бизнес-метрика «успевает моргнуть». Проблема в том, что это решение часто требует дополнительные ресурсы.

Привет, Хабр! Меня зовут Артем Ерохин, и я Data Scientist в X5 Tech. Я прочитал современные исследования, пропустил их через свой опыт и собрал концентрат подходов к работе с прокси-метриками. Постараюсь передать только суть. Разберемся, зачем нужны прокси, как с ними не выстрелить себе в ногу, где заканчивается польза и начинается самообман.

Читать далее

+8

25 сен 2025 в 09:10

Ваш грейд, стек и немного боли: опрос для data-специалистов

1 мин

866K

Блог компании X5 TechData Mining * Машинное обучение * Искусственный интеллектData Engineering *

Приветствуем всех коллег по цеху!

Мы в X5 Tech запускаем опрос, чтобы лучше понять, как живёт сообщество специалистов по работе с данными: какие инструменты используете, какие вызовы встречаете в работе и о чём мечтаете в свободное время.

Если ваша работа связана с данными, помогите нам узнать вас и ваших коллег лучше — пройдите наш опрос. А мы, в свою очередь, проанализируем ваши ответы и поделимся интересными инсайтами о data-специалистах на отдельном лендинге и расскажем об интересных кейсах по управлению данными из жизни data-сообщества X5.

Пройти опрос

+11

alaska_bear 23 сен 2025 в 15:11

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

20 мин

17K

Блог компании X5 TechIT-компанииИскусственный интеллектМашинное обучение *

Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске, по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.

Читать далее

+17

nik4ok 12 сен 2025 в 14:23

Дивергенция как мера специфичности аудитории вашей пилотной механики

11 мин

8.1K

Блог компании X5 TechНаучно-популярноеСтатистика в ITPython * Математика *

Хабр, привет! На связи Никита и Егор, мы работаем над продуктовой аналитикой в дирекции по развитию программы лояльности Х5. В статье мы бы хотели рассказать вам о том, как можно использовать модификацию дивергенции Кульбака-Лейблера для ответа на вопрос, а насколько ваша пилотная аудитория специфична относительно генеральной совокупности всех клиентов, и какие могут быть «подводные камни».

Читать далее

+4

a-meneylyuk 28 авг 2025 в 13:37

Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах

11 мин

8.1K

Блог компании X5 TechIT-компанииМашинное обучение * Искусственный интеллект

Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech. В этой статье расскажем, как мы научили поиск извлекать важные сущности из запросов пользователей. Полный разбор реализации NER (Named Entity Recognition) для продуктового ритейла, шаг за шагом: как мы размечали данные, считали метрики на уровне токенов и сущностей — и почему для коротких и длинных запросов потребовались разные архитектурные решения.

Читать далее

+4

nikita_volkov 25 авг 2025 в 14:48

Несогласованность эффектов или «Где деньги, Лебовски?»

Средний

13 мин

11K

Блог компании X5 TechСтатистика в ITМашинное обучение * Data Mining * Big Data *

Туториал

В статье рассматриваются проблемы, возникающие при оценке эффектов A/B-тестов и Causal Inference в ритейле, когда необходимо анализировать изменения выручки по различным категориям товаров и общей (тотал-) категории. Мы подробно рассмотрим, почему простое суммирование оценок эффектов по категориям не всегда дает корректную оценку для тотал-категории, и предложим эффективный способ решения этой проблемы.

Читать далее

+7

Mixiw 25 июл 2025 в 08:08

Как мы делали персонализированные баннеры с помощью ИИ

Простой

3 мин

5.7K

Блог компании X5 TechIT-компанииИскусственный интеллектМедийная реклама *

Кейс

Привет, Хабр!

Я — Михаил Суворов, технический менеджер продуктов искусственного интеллекта.
В статье я расскажу про наш кейс создания персонализированных баннеров с помощью ИИ.

Читать далее

+4

nnazarov 10 июл 2025 в 09:12

Проблема подглядывания и последовательное А/Б тестирование

12 мин

7.5K

Блог компании X5 TechPython * Математика * Статистика в IT

✏️ Технотекст 8

Хабр, привет! Сегодня узнаем, что такое проблема подглядывания и почему она появляется. Реализуем аналог метода Покока и критерий Вальда для последовательного тестирования. Посмотрим, можно ли одновременно подглядывать и контролировать вероятности ошибок при том же размере групп. Обсудим границы применимости последовательного тестирования.

Читать далее

+9

AlDemidov 9 июн 2025 в 11:54

Как автоматизировать создание CJM с помощью ИИ?

Простой

7 мин

14K

Блог компании X5 TechКлиентская оптимизация * Искусственный интеллектIT-компании

Меня зовут Александр Демидов, я бизнес-аналитик в X5 Tech. В этой статье я постараюсь по существу рассказать как я полюбил создавать карты клиентского пути (CJM), что помогло мне делать их в 4 раза быстрее и почему искусственный интеллект настоящая палочка-выручалочка при верном подходе.

Читать далее

+9

VasiliyS178 22 мая 2025 в 13:18

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2

Простой

14 мин

8K

Блог компании X5 TechPython * Алгоритмы * Хранение данных * Data Engineering *

Туториал

✏️ Технотекст 8

Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в Х5 Tech, успел за это время познакомиться с несколькими интересными проектами и подходами в области обработки данных, об одном из которых пойдет речь далее.

В этой статье расскажу о том, как можно повысить эффективность хранения данных за счет уменьшения их дублирования.

Разберем, что из себя представляют Slowly Changing Dimensions-2 (далее SCD-2) таблицы и самостоятельно реализуем на PySpark алгоритм сохранения данных в них. Попутно поговорим о том, как находить изменения в любой таблице, даже если отсутствуют поля для выбора изменившихся записей, и научимся получать из созданной SCD-2 таблицы срезы на требуемую дату в прошлом.

Читать далее

+5

nnazarov 11 апр 2025 в 12:23

Мифы о байесовском А/Б тестировании

11 мин

12K

Блог компании X5 TechPython * Математика * Статистика в IT

Хабр, привет! Сегодня сравним два подхода к А/Б тестированию: байесовский и частотный. Обсудим сложности в интерпретации p-value. Посмотрим, как можно учитывать дополнительную информацию через априорное распределение. Остановим тест раньше времени и решим проблему подглядывания.

Читать далее

+10

smatrosov 3 апр 2025 в 11:04

Welch's test: он вам не замена Т-test'a

Средний

30 мин

8.4K

Блог компании X5 TechСтатистика в ITАналитика мобильных приложений * IT-компанииВеб-аналитика *

Туториал

Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

Читать далее

+5

gofat 18 мар 2025 в 07:35

Разметка данных с использованием LLM

12 мин

13K

Блог компании X5 TechIT-компанииМашинное обучение * Искусственный интеллектNatural Language Processing *

✏️ Технотекст 8

Всем привет! Меня зовут Артем Ерохин. Я работаю в X5 Tech в направлении продуктивизации ИИ. В прошлом году у меня был доклад про разметку данных с LLM. И я решил преобразовать этот доклад в статью, попутно обновив некоторые цифры и тезисы (такова уж скорость прогресса в этой области).

Читать далее

+15

AGumenyuk777 10 мар 2025 в 09:21

Как я стал ментором: опыт, уроки, шаблоны

8 мин

5.9K

Блог компании X5 TechКарьера в IT-индустрииIT-компанииУправление персоналом *

Кейс

Привет, Хабр! Меня зовут Александр Гуменюк, я менеджер центра компетенций бизнес-аналитиков в X5 Tech. В 2016 году я пришел в IT-отдел торговой сети «Перекрёсток» в роли бизнес-аналитика. Первые полгода прошли под девизом: «Ничего не понятно, но очень интересно!». А сегодня я уже шестой год руковожу командами бизнес-аналитиков. За это время я прошёл путь от менти до ментора — и понял, что менторство может здорово прокачать не только людей, но и бизнес.

Почему это важно? В ритейле, где я работаю, всё меняется молниеносно: процессы, данные, люди. Без поддержки опытных коллег «новички» тонут, а «старички» выгорают. Менторство помогает расти быстрее, чувствовать себя увереннее и не бояться ошибок. В статье я расскажу, как сам стал ментором, какие подходы выстроил и что это дало моей команде. Будут реальные кейсы, мой шаблон для менторских сессий и набор инструментов, которые вы сможете взять и попробовать.

Читать далее

+4

Mixailkys 24 фев 2025 в 14:44

Искусственный интеллект в ритейле: как он предсказывает вашу следующую покупку в приложении

Средний

9 мин

7K

Блог компании X5 TechМашинное обучение * Математика * Искусственный интеллектIT-компании

Обзор

Привет, Хабр! На связи подразделение ad-hoc аналитики X5 Tech. Сегодня мы расскажем о задаче Next Basket Recommendation (NBR) и о том, как она может быть полезна для онлайн-ритейла. В этой статье мы рассмотрим, как с помощью рекомендательных моделей можно предсказать, какие товары пользователь добавит в свою следующую корзину, и как это помогает улучшить взаимодействие с приложением. Вы узнаете о ключевых метриках, которые используются для оценки качества рекомендаций, а также познакомитесь с различными подходами — от простых частотных методов до современных моделей на основе глубокого обучения.

Читать далее

+13

Impossiblenickname 14 фев 2025 в 07:00

Как проектировать скелетоны

11 мин

16K

Блог компании X5 TechДизайнИнтерфейсы * Читальный залУправление разработкой *

Обзор

✏️ Технотекст 7

Хабр, привет, это снова я! Меня зовут Антон, я дизайнер b2b продуктов в X5 Tech. Мне нравится моя работа и я стараюсь проектировать реализуемые интерфейсы, поэтому постоянно закапываюсь в технические нюансы.

Какое‑то время назад я писал статью про загрузочные экраны и там коротко рассматривал скелетоны, но делал это не настолько подробно, насколько хотелось бы. Тема богатая, сложная и простая одновременно, надеюсь, понравится. Запасайтесь любопытством, а я, в свою очередь, поделюсь опытом в проектировании скелетонов.

Научиться

+19

EgorovM 7 фев 2025 в 07:16

Построение инфраструктуры для работы с языковыми моделями: опыт X5 Tech

4 мин

4.9K

Блог компании X5 TechIT-инфраструктура * Искусственный интеллектIT-компании

✏️ Технотекст 7

Привет, Хабр! Я Мичил Егоров, руководитель команды разработки продуктов искусственного интеллекта в X5 Tech. В последнее время языковые модели (LLM) стали неотъемлемой частью многих бизнес-процессов, начиная от чат-ботов и заканчивая автоматической обработкой отзывов клиентов. Однако, чтобы эффективно использовать такие модели, необходима мощная и гибкая инфраструктура.

За последний год команда X5 Tech значительно выросла, проверила множество гипотез и протестировала различные модели. Основные кейсы использования включают чат-боты, суфлёры для модераторов, автоматическое резюмирование и обработку отзывов клиентов. В этой статье расскажу, как команда X5 Tech построила инфраструктуру для работы с языковыми моделями, какие вызовы преодолели и какие решения были приняты.

Читать далее

+11

nnazarov 31 янв 2025 в 11:42

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

9 мин

4.6K

Блог компании X5 TechМашинное обучение * Data Mining * Искусственный интеллектПрограммирование *

✏️ Технотекст 7

Хабр, привет! Меня зовут Николай Назаров, я работаю аналитиком данных в X5 Tech. Недавно завершился чемпионат по программированию Yandex Cup ML Challenge 2024, в котором я занял второе место в задаче “Self-driving cars: предсказание движения беспилотного автомобиля”. В статье расскажу про задачу и подходы, которые использовал для решения.

Читать далее

+11

allendorf 23 янв 2025 в 10:28

Как навести порядок в Figma и уменьшить ошибки на дизайн-ревью

5 мин

9.8K

Блог компании X5 TechУправление проектами * ДизайнИнтерфейсы * IT-компании

Туториал

✏️ Технотекст 7

Всем привет, меня зовут Илья Аллендорф, я занимаюсь дизайном внутреннего продукта в X5 Tech. В статье расскажу, как я улучшил подготовку макетов для разработки и навёл порядок в рабочем проекте в Figma.

В 2023 году я пришёл в новый продукт, который разрабатывался с нуля. За два года мы запустили MVP, перевели бизнес-процесс в продукт, достигли целевых метрик, а ещё совершили ошибки и сделали ценные выводы. Кроме того, мы ускорили сycle time, улучшив взаимодействие с дизайном: навели порядок в Figma, договорились с аналитиками, упростили жизнь разработке и уменьшили этап дизайн-ревью.

Теперь обо всём по порядку

+12

2

3 4 ...