Pull to refresh
4K+
8
3
Rating
25
Subscribers
Send message

Тонкости Kafka Connect и Debezium

Level of difficultyMedium
Reading time5 min
Reach and readers7.5K

Привет! Меня зовут Ильсаф, я инженер данных в MAGNIT OMNI — бизнес-группе ритейлера «Магнит», которая отвечает за развитие омниканального опыта для клиентов. В этой статье я собрал свои практические наблюдения по работе Kafka Connect и Debezium с PostgreSQL: от настройки репликации до мониторинга и бэкфиллинга.

Читать далее

Как мы подружили DataLens и OpenMetadata: архитектура, код и подводные камни

Level of difficultyMedium
Reading time4 min
Reach and readers5.6K

Всем привет! Меня зовут Саша, я тимлид в DWH MAGNIT OMNI — бизнес-группе ритейлера «Магнит», которая отвечает за развитие омниканального опыта для клиентов.

Недавно ребята из Datalens проводили вебинар в честь выпуска Public API, в котором я принял участие. Эта статья — развернутая версия моего доклада об интеграции Datalens с OpenMetadata.

Читать далее

Почему проваливаются проекты? 5 столпов, на которых держится успех

Level of difficultyMedium
Reading time7 min
Reach and readers5.5K

Корпоративный мир ушёл далеко вперёд. Если 10 лет назад сотрудники выходили на работу, чтобы создавать продукты «с нуля», то сегодня конъюнктура изменилась. IT-ландшафт крупных компаний перенасыщен решениями на любой вкус. На смену классическому проектному управлению, ориентированному на создание чего-то нового, пришло управление продуктами, где гибкие методологии работают на развитие и стабилизацию уже существующих систем.

Но любой продукт когда-то был просто идеей. Поэтому давайте договоримся о терминах: в этой статье проект — это нулевая ступень, фундамент, с которого начинается жизненный путь любого продукта. Расскажу об этом подробнее на примере из личной практики.

Читать далее

Геймификация квартального планирования

Level of difficultyMedium
Reading time3 min
Reach and readers5.5K

Привет!

Меня зовут Дмитрий Клопов. Я продакт-менеджер: отвечаю со стороны продукта за B2B-стрим в агрегаторе доставки готовой еды «Магнит Рестораны», входящего в состав бизнес-группы Магнит OMNI. 

В рамках своего стрима я регулярно сталкиваюсь с необходимостью квартального планирования в условиях большого количества заказчиков — 15–20 человек — и ограниченного капаситета команды разработки. У каждого заказчика свои приоритеты, ожидания и аргументы, и при этом все они конкурируют за один и тот же ресурс команды.

Ниже я расскажу о подходе, который мы используем для квартального планирования B2B-стрима. Он позволяет сделать приоритизацию фич более наглядной и осознанной для всех участников процесса.

Читать далее

DAG-классификация: как мы научили поиск определять нужную категорию ступенчатым образом

Level of difficultyMedium
Reading time6 min
Reach and readers5.9K

Одна из важнейших задач поиска — релевантная выдача. Простых универсальных решений здесь нет, а улучшение поиска — долгосрочный процесс, где крупные задачи приходится разбивать на небольшие, последовательные шаги.

В этой статье делимся тем, как нам в «Магнит Маркете» удалось значительно улучшить качество поиска с помощью нетривиального подхода: ступенчатой классификации категории поискового запроса.

Читать далее

Как мы построили систему матчинга товаров с помощью трансформеров и LLM

Level of difficultyMedium
Reading time3 min
Reach and readers6.3K

Привет! Мы — команда ML-разработчиков «Магнит Фудтех», входящей в состав бизнес-группы Магнит OMNI. 

Меня зовут Виктория Костерина, я тимлид команды. В этой статье мы вместе с моим коллегой, ML-инженером Богданом Тонанайским, рассказываем, как создавали систему автоматического сопоставления товаров между ассортиментом конкурентов и товарами «Магнита».

Этот проект очень важен в рамках нашей аналитики электронной коммерции: он помогает находить точные соответствия между товарами, даже если их названия, описания или формулировки различаются. Это необходимо для корректного ценообразования, формирования матрицы ассортимента и оценки конкурентной позиции.

Читать далее

Как использовать Clickhouse без боли

Level of difficultyMedium
Reading time9 min
Reach and readers8.8K

ClickHouse — одна из самых популярных систем для анализа данных. По информации TheirStack, этот инструмент использует более 3 700 компаний по всему миру. 

У ClickHouse быстрая аналитика, эффективное сжатие и отличное масштабирование. Но у системы есть и недостатки — ограниченная поддержка UPDATE и DELETE, а также сложная миграция.

Привет, Хабр! Меня зовут Михаил Филимонов, я руковожу разработкой хранилища данных в группе Магнит OMNI. В этой статье я расскажу о проблемах работы с ClickHouse, как их решать и какие инструменты для этого потребуются. 

Читать далее

Как мы научили ИИ превращать отзывы в деньги

Level of difficultyMedium
Reading time10 min
Reach and readers7.2K

Привет, Хабр! Меня зовут Артём Гриппа, я руковожу направлением продуктов поддержки клиентских отзывов в Магнит OMNI. Сегодня хочу рассказать о том, как команды моего направления — клиентских отзывов и платформы опросов — вместе с нашими стейкхолдерами создали систему работы с клиентской обратной связью, которая влияет на бизнес-результаты. Не просто собирает красивые метрики для отчётов, а превращает каждый отзыв в конкретные действия и, что немаловажно, в дополнительную выручку. Причём речь идёт не о паре сотен отзывов, которые можно прочитать за чашкой кофе, а о полутора сотнях тысяч ежедневных комментариев, которые физически невозможно обработать без автоматизации.

Читать далее

CDC без боли: как мы делали отказоустойчивую репликацию с Debezium и Kafka

Level of difficultyMedium
Reading time8 min
Reach and readers13K

Я Евгений Прочан, в платформенной команде Magnit OMNI развиваю инфраструктуру DWH. Расскажу здесь, почему нам понадобилось перейти от батчинга к CDC и как мы это делали. Причин перехода было две: потребность бизнеса в расширении возможностей инфраструктуры и нестабильность нашего старого процесса репликации. 

Мы используем в основном базы данных PostgreSQL. Оттуда пакетами раз в час передаём данные в S3, ClickHouse и таблицы Iceberg. Наша потоковая нагрузка достигает примерно полутора терабайта данных, 6000 операций в секунду (около 1500 в самой нагруженной базе данных). 

Читать далее

Оптимизация инсертов в ClickHouse через Kafka Sink-коннекторы

Level of difficultyMedium
Reading time12 min
Reach and readers7.1K

Меня зовут Артем Москальков, я — ведущий инженер данных в Магнит OMNI. В статье я расскажу о том, как мы оптимизировали производительность кластера в ClickHouse.

Частые мелкие вставки данных через Kafka Sink-коннектор серьёзно замедляли работу ClickHouse из-за огромного числа отдельных запросов. Путём настройки параметров потребителя Kafka и включения объединения партиций удалось сгруппировать записи в крупные блоки, что резко снизило нагрузку на базу и многократно увеличило её пропускную способность.

Читать далее

Как построить инфраструктуру, которая не подведет: главное с митапа по отказоустойчивости

Level of difficultyEasy
Reading time2 min
Reach and readers2.6K

23 апреля на OMNI Infrastructure Meetup эксперты из Авито, Магнит OMNI, Лаборатории Касперского и Cloud.ru обсудили, как создавать системы, устойчивые к любым сбоям. Рассказываем о самых важных инсайтах.

В московском офисе Магнита и онлайн собрались DevOps-инженеры, платформенные специалисты и разработчики, чтобы разобрать реальные кейсы повышения отказоустойчивости. Гибридный формат позволил присоединиться участникам из разных городов — дискуссия получилась по-настоящему живой.

Делимся видео и презентациями докладов.

Читать далее

Как мы решаем socio-tech проблемы в продукте: подход Split Group Fix

Level of difficultyEasy
Reading time5 min
Reach and readers2.1K

Socio-tech проблемы — это сложности в бизнес-процессах, возникающие на стыке технологий и поведения людей. Значит, и решать их нужно сочетанием технических и поведенческих мер. Меня зовут Роман, я директор по продукту «Магнит Фудтеха». Это направление входит в бизнес-группу «Магнит OMNI», объединяющую три вертикали: сервис доставки, маркетплейс «Магнит Маркет» и программу лояльности «Магнит Плюс». На примере сборки заказов я расскажу, как мы решали одну из возникших у нас проблем с применением подхода Split Group Fix. В этой статье я сделаю упор именно на социальную часть.

Читать далее

Как стать генеральным директором: путь от тестировщика до CEO

Level of difficultyEasy
Reading time6 min
Reach and readers8K

Должность генерального директора кажется чем-то далёким и недостижимым, когда ты только начинаешь карьеру в аналитике. Но мой опыт доказывает: с упорством, любопытством и жаждой знаний возможно всё. 

Меня зовут Константин Измайлов, я CEO «Магнит Маркета». Это направление входит в бизнес-группу Магнит OMNI, объединяющую три вертикали: маркетплейс, сервис доставки «Магнит Фудтех» и программу лояльности «Магнит Плюс». Хочу поделиться своей историей — с её ключевыми моментами, трудностями и уроками, которые сделали меня тем, кто я есть.

Читать далее

Information

Rating
1,285-th
Registered
Activity