Comments / Profile of a_si

@a_si_lex

User

Subscribers

ProfileArticlesPostsNewsComments8

Наши 5 лет с инфраструктурой «ВсеИнструменты.ру»: от нескольких ВМ до отказоустойчивого решения в трёх дата-центрах

a_si_lex Jan 24 2023 at 15:46

Спасибо за большой вопрос) попробую ответить коротко по порядку:

Heatmap есть, используется для анализа географии открытия новых торговых точек.
Анализ траффика по сезонности и неделя к недели есть, учитывается при планировании подготовки сервисов к росту нагрузки. Начиная с ковида 2020 года, год к году сильно отличается и необходимо делать поправку. + у нас не такой бизнес когда может произойти резкий всплеск траффика даже в распродажи, не тот сегмент товаров.
Анализ проводится при написании посмортемов и есть деление сервисов на критичные и не критичные для бизнеса. Считаем стоимость минуты простоя от выручки, либо потерянные заказы.
По поводу резервирования, большинство сервисов одновременно работают в 3 ДЦ и это также требование для разработки новы , трафик идёт сразу в 3, в случае инцидента трафик снимается с 1го ДЦ или сервиса в этом ДЦ и дальше уже разбираемся с проблемой. То же самое касается обновлений сервисов, раскатывать можем на 1ДЦ и в случае отсутствия проблем, продолжать с другими.
Нет, сейчас инфраструктура это colocation + cloud под определённые сервисы.
Про SLI/SLO/SLA: Grafana + Prometheus + алерты на команды в зависимости от их графика дежурства на сервисе и эскалации. Влияние на бизнес-метрики считаем, но пока это больше при написании посмортемов сводим вместе и считаем конечное влияние на бизнес например в потерянных заказах, подведенных клиентах, относительно того когда обещали клиенту доставить заказ, ....
Mysql полностью устраивает для тех задач где используется, кроме наверное того что это не версия 8.x, а 5.7.
Касаемо подготовки по изоляции данных - мы стараемся уйти от зависимости конкретной РСУБД, в новых проектах заставляя организовывать всю логику работы внутри приложения. Но это очень сложно сделать с монолитами.
Касаемо восстановление - дробления нет, восстанавливается все целиком. Есть реплики, где можно снять бэкап приостановив репликацию.
PostgreSQL + Patroni у нас тоже есть, из крупных инсталляций это WMS и CRM, работает так же на мультицод.
Про Rabbitmq: Мы уже успели перейти на Kafka, в статье это не затронуто, так как делалось отдельно от ребят из Фланта

a_si_lex Jan 24 2023 at 08:16

170 разработчиков это суммарно по системам - ERP, WMS, PDM, CRM, сайт, мобильное приложение, 1C, системы отчётности, ценообразование, поиск, логистика, телефония, закупки, ... и это далеко не всё. Получается не так и много на каждый сервис.

За обратную связь спасибо, передал коллегам!

Как мы решаем проблемы со склонением слов для задач seo-оптимизации с помощью phpMorphy

a_si_lex Sep 15 2022 at 20:04

Мы используем его как веб-сервис, взаимодействуя через API

Как мы решаем проблемы со склонением слов для задач seo-оптимизации с помощью phpMorphy

a_si_lex Sep 15 2022 at 18:58

Несколько лет, в качестве локального сервиса/микросервиса, используем https://morpher.ru/

Как мы теперь реагируем на аварии на проде (и пара примеров)

a_si_lex Jan 15 2022 at 13:49

Для команд разработки есть SLA по инцидентам в 30 дней на решение задач

Спасибо за статью, интересно! А какой реальный на данный момент, укладываетесь ли в 30 дней и кто несёт ответственность за этот показатель?

Английский язык: взгляд инженера

a_si_lex Jul 26 2018 at 19:22

Спасибо за статью, очень доходчиво и конструктивно!

10 лет жизни и опыта компании «Флант» в одном посте

a_si_lex May 19 2018 at 06:14

С юбилеем Flant! Всё ещё только начинается! Спасибо за вклад в Open source и интересные, подробные статьи на хабре

Dell Storage SC9000: интеллектуальная система хранения для эффективного дата-центра

a_si_lex Jun 23 2016 at 20:49

Пользуемся таким около 3 месяцев, в целом довольны, хотя без проблем не обошлось в начале. Ждём обновления ОС