zoomer499 Dec 11 2023 at 12:49

Оптимизация DevOps: Как персональные стенды и Grafana улучшают разработку и мониторинг

Medium

8 min

9.6K

Bimeister corporate blog.NET*IT Infrastructure*Data visualization*DevOps*

✏️ Technotext 2023

+11

Comments 5

bordakovskiy Dec 12 2023 at 13:02

Классная статья, спасибо!
а как организовали вывод логов из проблемных подов в pipline?

zoomer499 Dec 12 2023 at 15:56

Если вкратце, после того как запустили helm upgrade --install, скачиваем на раннер скрипт kubectl_show_error, который ищет есть ли в развернутом неймспейсе поды с ошибками:

PROBLEM_PODS="kubectl get pods -n " class="formula inline">ENV_NAME -o jsonpath='{range .items[]}{.status.containerStatuses[].ready} {.metadata.name} {end}' | grep "false" | rev |cut -d ' ' -f1 | rev )"

И далее выводим лог ошибочного пода в вывод раннера который и отобразит это в пайплайне. Пример такого вывода:

Надеюсь в следующем году опубликуем еще пару статей по поводу того как у нас устроена архитектура пайплайнов в части билдов/сборок чартов/деплойментов, там есть много интересного о чем рассказать.

bordakovskiy Dec 12 2023 at 17:11

Всё гениальное просто) спасибо большое.

SemiHDD Dec 18 2023 at 09:11

Обычно же после окончания helm upgrade --install под удаляется если не смог нормально подняться, как тогда получаете их логи?

Можете по шагам объяснить когда запускаете ваш скрипт ?

zoomer499 Dec 19 2023 at 10:23

Выполняется upgrade, не ожидания окончания обновления, проверяется namespace на наличие ошибок и проблемных подов, и если такие поды есть их логи выводим в в лог пайплайна. По-сути процес похож на ручной дебаг, когда запустили helm и с помощью kubectl проверяем все ли раскатывается правильно и без ошибок. Надеюсь в ближайшее время выпустим серию статей, про устройству нашего CI/CD. Там более наглядно разберем такие моменты и как они помогают жизни разработчика/тестировщика.