Как стать автором
Обновить
8
0
Дмитрий Бобылев @zhoglo

VP of Technology

Отправить сообщение
В списке запланированных тем у меня она пока идет 5й, добавил коммент в закладки и вернусь, как материал будет готов. Как раз про тех. детали
Про какую часть хочется узнать подробнее? Про технические или организационные моменты?
Ответил на первую часть вопроса про инструменты ниже, промахнулся комментарием ;)
Для анализа все способы выше применимы, но удобнее использовать утилиту из Percona Toolkit
pt-query-digest — Analyze MySQL queries from logs, processlist, and tcpdump.
Удобно использовать, если есть возможность собирать и получить доступ к slow логам.

Как использовать хорошо в доках показано. Приведу пример части вывода этой утилиты:
# Profile
# Rank Query ID                    Response time    Calls   R/Call V/M   I
# ==== =========================== ================ ======= ====== ===== =
#    1 0x3C0A5A053D9DA60145DF32... 22287.3511 50.1%   18708 1.1913  0.01 SELECT ***
#    2 0xFFFCA4D67EA0A788813031...  3255.4295  7.3%   38424 0.0847  0.03 COMMIT
#    3 0x3D546FC71D1245D04E4215...  2142.2965  4.8%   16518 0.1297  0.01 SELECT ***
#    4 0xEFBDDA4050BEB86ACA5DEF...  1403.1128  3.2%   15013 0.0935  0.01 SELECT ***

Удобно выводит Response time — общее время и процент от общего, даже утруждать себя подсчетами не нужно. В отчете по каждому запросу есть другая подробная информация, рекомендую.
Управление инцидентами, о котором говорилось в статье — это фиксация и отработка инфраструктурных проблем на production-серверах. Возможно, спустя некоторое время с нашим текущим подходом я буду готов поделиться опытом.

Могу предположить, что ситуации, о которых вы говорите, были связаны с услугой «бесконтактная доставка до двери» и некоторой путаницей на лестничной площадке. Служба заботы о клиентах оперативно решает такие проблемы: связывается с клиентами и дает компенсацию в случае проблем с заказом.

Большим вызовом для нас было наладить коммуникацию в цепочке Клиент-Закупщик-Курьер-КоллЦентр. Мы весной интегрировали сквозную CRM-систему во все служебные приложение, которая сохраняет всю историю взаимодействий по каждому заказу (ранее это было реализовано неудобно через сторонние чаты).

После исполнения заказа клиент выставляет оценки, сводные показатели которых real-time собираются в дэшборды. В них подсвечиваются лучшие курьеры и сборщики и те, кто сталкивается с проблемами.
С этим отчетами постоянно работают лидеры точек, чтобы держать руку на пульсе и улучшать работу команд.
Оказалось, что «усреднение» графика поступления заказов не всегда работает на практике. Вот пример «горячей поры», когда у нас были забиты слоты на доставку и клиенты «ловили» свободные слоты, мы получали ~1000 заказов за 10 минут в 3 часа ночи.


По нагрузке вопрос очень закономерный. Характер нашей работы с множеством магазинов, постоянного обновления цен по всем товаров создает дополнительную внутреннюю нагрузку. По внешней нагрузке мы выросли с 4000rpm до 45000 rpm (в 10+ раз) за короткий промежуток времени — это только backend размещения заказов (сборка обслуживается отдельно). Тогда это был для нас серьезный вызов, сейчас мы работаем с этой нагрузкой в штатном режиме.

Про размер команды:
С нами сотрудничает сейчас больше 10 тысяч курьеров и экспертов по закупкам, но в команде разработки и продукта суммарно всего 60 человек.
Мы планируем вырасти до 200 — задач у нас много.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность