Comments / Profile of Nastradamus / Habr

How to become an author

Виктор Ягофаров @Nastradamus

DevOps, Kubernetes, Monitoring, Postgres, Golang

Profile Publications 9Comments 837Bookmarks 170

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

Nastradamus Aug 7 2020 at 13:00

350 — буквально все разрабы имеют что-то своё в кубе: включая мобильную разработку и фронтенд. Даже у меня там несколько pet projects, хоть я и админ =)

+1

Kubernetes в ДомКлик: как спать спокойно, управляя кластером на 1000 микросервисов

Nastradamus Aug 7 2020 at 12:10

Ответ на вопрос моей мамы «чем я занимаюсь на работе» =)

+9

Хаос-инжиниринг и непрерывная проверка прода

Nastradamus Jun 26 2020 at 13:04

Ну если отбросить тот момент, что чувак рекламирует свой продукт (как и большинство выступающих на конференциях владельцев бизнесов), то можно найти в статье и довольно интересные мысли. В принципе, Kubernetes тоже начинался с таких вот философских статей с налетом маркетинга.

+6

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Jun 26 2020 at 00:28

Здорово, очень круто! ) У меня такой патч был для pgbouncer (пулер соединений для Postgres) — пул-реквесту уже 5 лет :)

А в куб что-либо контрибьютить вообще нет желания, глядя на срачи других контрибьютеров с «кураторами». Проще накатать фича-реквест, а для себя просто поправить несчастные 2 строчки кода и закрыть рабочую задачку.

0

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Jun 25 2020 at 12:14

Каюсь, забыл ответить вовремя. Ответил выше на ваш комментарий.

+1

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Jun 25 2020 at 12:14

Прошу прощения, хотел тогда детально разобрать ваш столь интересный комментарий, но что-то меня отвлекло и я просто забыл. А жаль — было бы очень интересно подискутировать. :(

Staticcheck в последние разы у меня тоже не ругался и я сейчас не могу вспомнить с чего я вообще взял что он ругался. Возможно я что-то делал не так и это была вообще другая ветка. Пожалуй, удалю инфу про staticcheck из статьи.

К сожалению у меня обновился GoLand на MacOS и в нем перестал открываться мой старый coredump (как и любой coredump, снятый в Linux). Теперь не могу вернуть всё как было и посмотреть заново. Поэтому, я сейчас не смогу пальцем тыкнуть в точное место в коде, в котором не очищается структура с TCP-соединениями.
Мало того, сейчас я наверное и не в состоянии был бы это сделать, так как уже месяца 3 не писал ничего на Golang.

Про UDP — оговорка вышла. nodelocaldns с «апстримами» соединяется по TCP.

И вообще — почему версии не обновлялись вовремя?

Потому что у нас исторически случился Kubespray, в который был «вшит» nodelocaldns. Обновляем сам Kubespray мы раз в 3-6 месяцев (вместе с обновлением Kubernetes). Пришлось выпилить из Kubespray nodelocaldns и перейти на собственный helm-чарт.
Обновление Kubespray — сомнительное удовольствие и каждую неделю обновлять его ну никак не получится. По сути — это задача сложнее чем обновить сам Kubernetes.

0

Представляем k8s-image-availability-exporter для обнаружения пропавших образов в Kubernetes

Nastradamus May 28 2020 at 14:50

О как, не знал) Наш форк оператора просто поддерживает много чего, чего нет из коробки.

Протестил вашу штуку — всё отлично. У нас правда свой аналог есть — который чистит лишнее по заданным правилам, ориентируясь по метрикам использования images от k8s api.

0

Представляем k8s-image-availability-exporter для обнаружения пропавших образов в Kubernetes

Nastradamus May 28 2020 at 13:32

  template:
    metadata:
      annotations:
        prometheus.io/port: "8080"
        prometheus.io/scrape: "true"

Поправьте deployment, пожалуйста, и примеры. Если прометеус оператор установлен, он подхватит такой деплоймент. Если его нет — хуже не будет.

+1

Как собрать NGINX Ingress Controller старой версии и пропатчить его

Nastradamus May 19 2020 at 15:31

К сожалению, на Go в последнее время редко пишу, а к пройденному этапу возвращаться лень ) ИМХО, я там и так дал новичкам все стимулы чтобы разобраться и привёл самые важные ссылки на эту тему :)

+1

Как собрать NGINX Ingress Controller старой версии и пропатчить его

Nastradamus May 19 2020 at 01:39

Угу, рассматривал его — у нас бы он превращался в форк-бомбу :)

0

Сравнение российской рэп сцены используя R и техники Text Mining. Noize Mc and Kasta vs Pharaoh and Morgenshtern

Nastradamus May 11 2020 at 17:07

А ваши исходники выложите?

0

Топ факапов Циан

Nastradamus May 3 2020 at 13:21

Тогда беру свои слова обратно =) Спасибо за уточнение. Хорошего Вам аптайма!

0

Топ факапов Циан

Nastradamus May 1 2020 at 13:41

Какие-то детские грабли, если честно :)

Например, можно использовать ELK для того, чтобы наблюдать за rps на каждый backend каждого upstream, следить за их временем ответа с точки зрения nginx.

Так делать получается пока у вас ELK стек жив и его никто не шатает. В первое же окно обслуживания ELK вы потеряете такую статистику.
Мы же мониторим RPS через метрики nginx ingress controller через Prometheus. А логи ELK — только как инструмент номер 2 и для логов по фронтам.
Просто те же перцентили по фронтам вообще не интересны для SRE — это ничего не говорит ответственным за сервис инженерам в случае с тысячами микросервисов и полного отсутствия монолитов.

+3

Почему мы выбрали Kotlin одним из целевых языков компании. Часть 2: Kotlin Multiplatform

Nastradamus Apr 30 2020 at 20:40

Аж захотелось для iOS что-нибудь написать для анализа трафика в сети )

0

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Apr 8 2020 at 09:39

Могу ответить, но это не точно: postgis, не больше 800GiB

0

/etc/resolv.conf для Kubernetes pods, опция ndots:5, как это может негативно сказаться на производительности приложения

Nastradamus Apr 5 2020 at 12:18

getaddrinfo() — это не системный вызов.

0

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Apr 4 2020 at 13:00

Так последняя версия сейчас 1.15.11 github.com/kubernetes/dns/tags

0

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Apr 3 2020 at 17:59

В момент внедрения nodelocaldns у нас, оно существовало лишь в альфе, а эксплуатировало в проде этот софт очень мало народу. Этот дивный новый мир.

0

Создание дополнительного kube-scheduler’a с кастомным набором правил планирования

Nastradamus Apr 3 2020 at 17:14

Спасибо за отличную статью. Собирался как раз изучить вопрос, а тут такой подарок.
Очень жаль, конечно, что политики дефолтного шедулера не описаны yaml'ом.

Вопрос: а нет подозрений какие политики кастомного шедулера привели к нормальному поведению?

Побежал накручивать мониторинг распределения подов в кластере :)

0

Отладка высоконагруженных Golang-приложений или как мы искали проблему в Kubernetes, которой не было

Nastradamus Apr 3 2020 at 14:32

А где кровавые подробности и пути решения, которые так необходимы новичкам? Или автор предлагает всем обращаться к Павлу?

Паша помог мне с командой:

cd ~/go/src/k8s.io/dns && \
GO111MODULE=off GOOS=linux go install ./... ./vendor/...

Дальше сам :)

Может есть смысл сделать видео с комментариями.

Спасибо за конструктив. Была идея сделать доклад на эту тему, но сами знаете что остановило :(

0

2

3 4 ...