Как стать автором
Обновить
Southbridge
Обеспечиваем стабильную работу highload-проектов

Слёрм DevOps. 3-ий день. ELK, ChatOps, SRE. И тайная молитва разработчика

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *Kubernetes *

Наступил третий и последний день первого, но не последнего Слёрма DevOps.


Мы не рассчитывали, что сможем повторить Слёрм DevOps. Но неожиданно для нас все спикеры согласились приехать на Слёрм в феврале, а фидбек показал, как именно доработать программу. Есть понимание, как сделать программу интенсива более целостной и детальной, а некоторые темы — более практичными. Так что в феврале мы собираемся провести Слёрм DevOps в Москве. Подробности будут ближе к декабрю. Анонс обязательно появится на Хабре.



6 сентября, на третий день Слёрма выступали четыре спикера.


Владимир Гурьянов, инженер/тимлид в Southbridge, выступление которого ещё на второй день Слёрма DevOps очень понравилось участникам интенсива. Владимир активный сторонник DevOps-подхода в работе, старается внедрять его повсеместно.


Павел Селиванов, признанная звезда Слёрмов, вдохновитель первого Слёрма по Kubernetes. О нём студенты писали, что «было бы здорово, если бы он вел всю программу». Павел является Certified Kubernetes Administrator. Обладает огромным практическим опытом внедрения Kubernetes — более 25 проектов в команде и индивидуально.


Эдуард Медведев, CTO в Tungsten Labs, разрабатывал и внедрял ChatOps при автоматизации дата-центров. После его выступления на Слёрме многие участники задумались о внедрении ChatOps в своих компаниях. Сейчас успешно выступает консультантом по безопасности.


Иван Круглов, Principal Developer в Booking.com, настоящая приглашённая звезда конференции. Именно ради его выступления некоторые участники записывались на Слёрм DevOps. В Booking.com занимался такими инфраструктурными проектами, как распределенная доставка и обработка сообщений, BigData и web-stack, поиск. Сейчас в списке его задач построение внутреннего облака и Service Mesh.


Мы взяли обширные интервью у Эдуарда Медведева и Ивана Круглова — по готовности опубликуем на Хабре.



Аудитория всем своим задумчивым видом демонстрировала лёгкую усталость. Два предыдущих дня интенсива заставили поработать на пределе, головы требовали отдыха и выходных. Но темы и спикеры третьего дня разогнали усталость и дрёму. Особенно Site Reliability Engineering и Иван Круглов.


Под завершение второго дня Слёрма было принято решение перенести мониторинг инфраструктуры c Prometheus на завтра. Интенсив оказался слишком интенсивным — не все участники выдерживали темп.



И потому третий день начался с выступления Владимира Гурьянова. Он кратко рассказал, зачем собственно нужен мониторинг. Описал и классифицировал типы мониторинга. Затронул вопрос уведомлений в мониторинге.


Очень живо зашли в аудиторию темы «Как построить здоровую систему мониторинга» и «Человекочитаемые уведомления». Владимир завершил выступление темой Health Check, на что стоит обратить внимание и как обустроить автоматизацию на основание данных от мониторинга.



Чтобы расшевелить сонных участников и активировать у них способности к обучению на максимум, следом за Владимиром Гурьяновым вниманием публики завладел Павел Селиванов с темой «Логирование приложения с ELK». Он показал участникам Слёрма наши best practices логирования и рассмотрел ELK стек.


После первого кофебрейка, насыщенного общением и печеньками, участники Слёрма заняли места в аудитории.


Выступления Гурьянова, Селиванова и алкалоид пуринового ряда кофеин сделали своё коварное дело. Кофеин добрался до аденозиновых рецепторов мозга, заместил там пуриновый нуклеозид аденозин, отвечающий за процессы торможения — чем попросту лишил участников Слёрма шанса на «полениться» и «подремать». Не все поняли, что произошло. Зато все взбодрились.


Таким образом аудитория была на сто процентов готова к дальнейшему обучению и активному поглощению знаний. И к выступлению Эдуарда Медведева.



Эдуард выступил с темой автоматизации инфраструктуры с ChatOps, рассказал об интеграции мессенджеров с пайплайнами.



Финалом третьего дня Слёрма и Слёрма DevOps в целом стало выступление Ивана Круглова, Principal Developer в Booking.com. Иван сразу же завладел вниманием аудитории, сознавшись, что у него в презентации более 140 слайдов, аккуратно тем самым намекнув, чтобы участники Слёрма не строили планов ни на саму пятницу, ни на выходные.



В интенсивном, длительном и глубоком выступлении Иван Круглов затронул тему DevOps и SRE, кто они друг другу, как соотносятся. Рассказал о «страшных терминах из мира SRE»: SLA, SLO, Error Budget и некоторых других.




Далее пошла практика и ещё больше практики — мониторинг SLI и SLO, применения Error Budget и управление прерываниями и операционной нагрузкой (apigateway, service mesh, circuit brackers). И ещё многое, многое другое.




Тайная молитва разработчика.


Так как тема SRE предельно обширна и рассказывать о нюансах можно хоть несколько дней, было решено, что в феврале на следующем Слёрме DevOps мы уделим ещё больше времени SRE и его практическому применению, как наиболее актуальной и востребованной технологии.


Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UI\UX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

После выступлений пришёл черёд многочисленных вопросов, как в офлайне, так и в рабочем чате Слёрм:


Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Участники Слёрма поделились впечатлениями:


Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

После конференции мы попросили участников оставить отзывы в форме Google Docs. Результаты нас порадовали и воодушевили.





Спасибо всем, кто был с нами — в офлайне, в конференц-зале Selectel, и в онлайне. И спасибо огромное читателям Хабра. "Слёрм окрыляет!"(с)

Теги:
Хабы:
Всего голосов 23: ↑19 и ↓4 +15
Просмотры 2.4K
Комментарии Комментировать

Информация

Дата основания
Местоположение
Россия
Сайт
southbridge.io
Численность
51–100 человек
Дата регистрации
Представитель
Антон Скобин