Comments / Profile of pepemon / Habr

@pepemon

Site Reliability Frog

ProfileArticlesPostsNewsComments64

Когда-то я внедрял ClickHouse в стартапе, где даже алерты мониторили индийцы — это был Дикий Запад

pepemon Jan 14 2021 at 14:49

А когда Citus успел стать неподдерживаемым?

Look

Опрос: разговор о повышении зарплаты — с готовым оффером или без?

pepemon Jan 8 2021 at 04:04

Очередная не такая как все SWE-снежинка надула щёчки!
Посмотрел в профиль, ещё раз ухмыльнулся. Почему-то постоянно попадаются выходцы из Я с синдромом "я очень особенный и классный", что в виде буковок в интернете, что в виде реальных коллег.

Look

Жизнь .NET приложения в Kubernetes

pepemon Jan 4 2021 at 16:58

Не используйте ReplicaSet даже для "максимально тестовых окружений".

Look

Сборка контейнеров без Docker

pepemon Dec 4 2020 at 11:09

был написан Джессом Фрейзеллом

Вы хотя бы немножко думайте, когда переводите. Девушка бы очень удивилась, узнав, что она усилиями русских переводчиков оказывается стала мальчиком. И вообще, где пометка что это перевод?

Look

Ультимативный гайд по собеседованию DevOps-инженеров — что спрашивать и к чему готовиться

pepemon Nov 13 2020 at 00:08

Вот такое же впечатление о статье сложилось. Вроде и по делу и вообще "базу нужно знать и помнить всегда", но такие нюансы портят впечатление о прочитанном.

Look

Наш опыт с графовой базой данных Dgraph в Kubernetes

pepemon Oct 30 2020 at 03:31

Спасибо за статью. Я же правильно понимаю, что у клиента в проде Community-версия? Как вы её бэкапите? Экспорт по расписанию?

Look

«Docker уже умер» или все, что вы хотели узнать про Devops, но боялись спросить

pepemon Oct 25 2020 at 16:45

Да, благо что большая часть CNI в Kubernetes сделана более грамотно, чем сеть Docker.

Look

«Docker уже умер» или все, что вы хотели узнать про Devops, но боялись спросить

pepemon Oct 25 2020 at 15:33

Аргументация негативного опыта уровня "Я не разобрался в командной строке, ваш Linux — УГ!". У меня средний production-образ весит ~20-50mb, это я ещё туда системную обвязку для траблшутинга втаскиваю (всякие nc, dig, netstat, tcpdump и т.д.). Как же так?

Look

Технология Apphost: альтернативная вселенная микросервисов в Яндексе

pepemon Sep 22 2020 at 23:06

Не уверен, что, например, готовый универсальный Nginx может проиграть чему-то самописному, даже написанному профессионалами со знанием предметной области. Потому что профессионалы со знанием предметной области возьмут как раз его. «Велосипеды» действительно существуют и не нужно считать что это всегда хорошо. NIH как явление не на пустом месте появилось.

Look

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

pepemon Aug 10 2020 at 21:58

А, видимо тянете с ELRepo, понял. Я с их конфигов собираю, но только 4.19.xxx.

Look

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

pepemon Aug 10 2020 at 13:02

А чем красношапочное ядро не устроило? А если билдить и мэйнтэйнить ядра самим, то почему не longterm посвежее? Один eBPF чего стоит.

Look

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

pepemon Aug 10 2020 at 11:47

перешли довольно болезненно с Helm 2, но очень рады опции atomic

А что не так с atomic в самом Helm 2? Данная опция в нём делает тоже самое, что и в Helm 3.

Look

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

pepemon Aug 10 2020 at 11:43

Императивным Ansible может быть только потому что вы его сами используете как Bash на стероидах. У меня на проекте используются ислючительно идемпотентные роли, никаких сайд-эффектов (то что вы называете "мусором") никогда не имелось. Ну и медленность давно уже лечится хоть тем же Mitogen.

Look

Простой service discovery в Prometheus через Consul

pepemon May 23 2020 at 13:49

Федерация — не самый оптимальный механизм агрегирования метрик. Лучше брать специализированное решение, я например в качестве "апстрима" для куберовских промов беру VictoriaMetrics, хотя там сейчас полно всякого, те же Thanos, Cortex и M3.
Кросс-мониторинг интересно, я обхожусь обычным watchdog (вечно файрящий алерт, отсутствие которого как раз и говорит что что-то не так). Есть ли у кросс-мониторинга какие-то скрытые плюсы? Watchdog кроме своей основной задачи ничего по сути и не умеет, но в целом здесь больше ничего и не надо.

Look

Простой service discovery в Prometheus через Consul

pepemon May 22 2020 at 19:50

Мы начали работать непосредственно с hashicorp

Я правильно понимаю, что у вас Consul Enterprise с честным суппортом? Если нет, то поделитесь пожалуйста issue на GitHub, очень интересно посмотреть на кейс, у меня разваливался консенсус серверов пару раз, но чтобы Raft наедался, такого не было.

Look

Простой service discovery в Prometheus через Consul

pepemon May 22 2020 at 16:59

Очень рекомендую, я тоже изначально в некотором роде следовал принципу Парето — нужно было что-то для организации динамического автоконфигурируемого DNS для VPC, взял Consul. После того как начал знакомиться с ним ближе, просто был ошарашен насколько продуманно он сделан и какой пласт задач способен решать. Не зря всё-таки в нашей индустрии вокруг HashiCorp сложился в некотором роде культ, они делают нереально крутые вещи.

Look

Простой service discovery в Prometheus через Consul

pepemon May 22 2020 at 15:48

Не сочтите за невежество, но Consul нужно выкатывать по всей инфре с агентом на каждой ноде, всё остальное — негуманный анти-паттерн. Consul для такого не предназначен и даже небольшая часть его потенциала не может быть реализована (конечно, возможно его использование в качестве распределенного KV-хранилища или механизма для распределённых локов, но моё субъективное мнение — в таком случае лучше взять etcd). Имея Consul на всём флоте, не нужно будет писать свои решения, можно использовать стандартные и существующие из коробки service definitions с healthcheck'aми и прочими радостями. При таком подходе на Consul можно строить что угодно, хоть DNS для инфры (для кэша лучше взять что-нибудь отдельное спереди, дабы не нагружать Consul-сервера и не вешать их на 53-й порт), хоть RR-балансировку (я, например, так обеспечиваю HA для куберовских kube-apiserver). C queries вообще можно реализовывать ещё более интересные вещи, я делал возможность через DNS получить текущего PostgreSQL-мастера в кластере Patroni.
Плюс, учитывая что у Prometheus есть конвенция, что метрики обычно отдаются по пути /metrics, я в SD просто забираю все сервисы, у которых есть тэг scrapable, и ставлю в значение job-лейбла имя сервиса через обычный релэйблинг. Одним job_name сразу всех зайцев, эдакий DRY.

Look

Долгий DNS resolve в Kubernetes

pepemon May 21 2020 at 14:18

Баг очень частый, на Хабре уже было несколько постов об этом, на GitHub в релевантом issue сотни комментариев. По сути настоящее решение — это только п.1 (что по сути является вариантом "ходим к coredns по TCP") — в musl воркэраунда с single-request-reopen нет, Weave CNI явно используется не всеми.

Look

Наш опыт миграции Cassandra между Kubernetes-кластерами без потери данных

pepemon Apr 24 2020 at 16:26

использование одинаковых pod network — не очень хорошая идея

Я правильно понял, что имелось ввиду то, что в рамках одного проекта в разных кластерах был установлен одинаковый pod-network-cidr / podSubnet?

Look

Подготовка сервера для публикации web-app на Python

pepemon Apr 22 2020 at 00:30

Автор, ничего личного, но в вашей статье больше вреда чем пользы. Абсолютное непонимание как работает Linux и systemd.

Look

3 4