Слёрм, Лиски (Воронежская обл.) - Учебный центр для тех, кто работает в IT / Статьи / Хабр

ПрофильСтатьи899Посты54Новости362Подписчики73K

geniyoctober 23 ноя 2021 в 06:00

Добро пожаловать в Зольни: как из стажировки Southbridge появилась новая компания

5 мин

1.8K

Блог компании СлёрмIT-компанииDevOps * Карьера в IT-индустрииСистемное администрирование *

С апреля 2021 года в Southbridge проходит стажировка для тех, кто хочет стать DevOps-инженером. За полгода мы запустили 6 потоков, в которых поучаствовало больше 80 человек. На старте планировали, что проект поможет нам подготовить DevOps-специалистов для себя. Оказалось, стажировка — отличная площадка для экспериментов, которые приводят к неожиданным результатам. Например, мы не ожидали, что из стажировки появится новая компания Зольни.

В статье рассказываем, какие идеи по развитию стажёрской программы у нас были, а также объясняем, что такое Зольни.

+14

geniyoctober 16 ноя 2021 в 13:06

История внедрения SRE в Dodo Engineering

10 мин

6.2K

Блог компании Dodo EngineeringБлог компании СлёрмDevOps * Управление разработкой * IT-инфраструктура *

Татьяна Гребенюкова, продакт-оунер курса Слёрм «SRE: внедряем DevOps от Google», собирает интересные кейсы внедрения SRE в российских компаниях. Некоторые истории мы используем для развития курса, а другими рады поделиться со всеми.

Сергей Бухаров, SRE из Dodo Engineering, рассказал историю внедрения SRE в компании, какие практики из книжек оказались неприменимы и из чего состоят будни SRE-команды.

+19

Polina_Averina 10 ноя 2021 в 10:00

HTTP/3: развёртывание HTTP/3 на практике. Часть 3

29 мин

24K

Блог компании СлёрмDevOps * Высоконагруженные системы * Веб-разработка * Серверное администрирование *

Перевод

Фото Wolfgang Rottmann, Unsplash.com

После почти пятилетних разработок протокол HTTP/3 наконец приближается к окончательному выпуску. Рассказываем, какие трудности могут возникнуть при развёртывании и тестировании HTTP/3 и как адаптировать к нему сайты и ресурсы.

Это третья и последняя часть серии о новых протоколах HTTP/3 и QUIC. Если, прочитав предыдущие две части об истории и основных концепциях и функциях производительности HTTP/3, вы решили, что новые протоколы срочно нужно внедрять (будем надеяться, что так вы и решили), здесь мы расскажем, как это сделать.

Читать дальше →

+21

SvetaUlyanchenko 27 окт 2021 в 08:20

Как настроить Jenkins в связке с Ansible

8 мин

29K

Блог компании СлёрмDevOps * Серверное администрирование * Программирование * Системное администрирование *

Эта статья — способ заглянуть в курс «Ansible: от первых шагов до большого проекта». Всеволод Севостьянов, Lead Engineer в Vene, отвечающий за пайплайны и deployment, показал, как настраивать Jenkins в связке с Ansible.

Читать

+15

SvetaUlyanchenko 20 окт 2021 в 08:06

Дыры и заборы в Kubernetes: кейсы взлома, советы как защитить свой кластер и рассказ о первых хакерах

9 мин

7.5K

Блог компании СлёрмИнформационная безопасность * IT-инфраструктура * DevOps * Kubernetes *

На вебинаре «Дыры и заборы: Безопасность в Kubernetes» встретились эксперты Максим Мошаров и Артём Юшковский, им задал вопросы ведущий Марсель Ибраев. Обсудили, как обезопасить свой кластер, показали три кейса взлома Kubernetes и рассказали, как строить безопасность в организации. В статье расскажем об этом подробнее, дополним комментариями экспертов и дадим промокод на скидку для участия в интенсиве «Безопасность в Kubernetes».

Читать статью

+15

Polina_Averina 19 окт 2021 в 15:14

HTTP/3: улучшения производительности. Часть 2

32 мин

19K

Блог компании СлёрмDevOps * Высоконагруженные системы * Веб-разработка * Серверное администрирование *

Перевод

Фото Jack Hunter, Unsplash.com

После почти пятилетней разработки протокол HTTP/3 наконец приближается к окончательному выпуску. Здесь мы узнаем, как в HTTP/3 улучшилась производительность, включая контроль перегрузок, блокировки HoL и установку соединения 0-RTT.

Это вторая часть серии о новом протоколе HTTP/3. В первой мы говорили о том, зачем нам вообще нужен HTTP/3, о протоколе QUIC и новых возможностях.

Читать дальше →

+23

geniyoctober 14 окт 2021 в 14:40

Как взглянуть на Kubernetes с другой стороны? Рассказывает Марсель Ибраев, CTO учебного центра Слёрм

3 мин

Блог компании Слёрм

18 октября на образовательной онлайн платформе Слёрм стартует новый курс: Мега – поток по популярной платформе оркестрации контейнеров с открытым исходным кодом Kubernetes. Программа курса максимально широкая – чуть более, чем за месяц участники освоят 12 тем, связанных с разворачиванием отказоустойчивого кластера и решением продвинутых задач по обеспечению стабильности и безопасности кластера и деплою приложений, узнают как Kubernetes работает изнутри, разберутся с тонкостями установки и конфигурации кластера и получат незаменимые практические навыки обращения с инфраструктурой.

+10

beantorong 24 сен 2021 в 09:44

Кто такой DevOps и почему это не то, что нам обещали

8 мин

10K

Блог компании СлёрмDevOps * Управление продуктом * IT-инфраструктура * Программирование *

Спикер курса «Python для инженеров», Денис Наумов, поделился своим пониманием DevOps с двумя примерами из практики: собственной и коллег.

Читать статью

+12

Konstantin_rnd 23 сен 2021 в 09:14

Как я написал свой ChatOps: опыт выпускника курса по Python

5 мин

9.7K

Блог компании СлёрмKubernetes * DevOps * Программирование * Python *

DevOps-инженер Константин Кулишов рассказал, как создал свой ChatOps, чтобы дать разработчикам возможность вносить изменения в проект в любое время. Константин выложил ChatOps на GitHub и подробно описал процесс создания.

Читать статью

+11

SvetaUlyanchenko 20 сен 2021 в 07:42

Опыт работы с Apache Kafka: интервью с inDriver

4 мин

5.6K

Блог компании СлёрмПрограммирование * IT-инфраструктура * Apache * DevOps *

DevOps-инженеры компании inDriver Радик Сейфуллин и Александр Плотников распилили старое монолитное приложение и создают новое, а Евгений Бутырин, технический редактор Слёрма, пообщался с ребятами об этом: опыте с Kafka, проблемах, решениях и обучении.

Читать интервью

Booka_Ltd 14 сен 2021 в 06:00

HTTP/3 от А до Я: основные концепции. Часть 1

20 мин

96K

Блог компании СлёрмDevOps * Высоконагруженные системы * Веб-разработка * Серверное администрирование *

Перевод

Фото Florencia Viadana, Unsplash.com

После почти пятилетних разработок протокол HTTP/3 наконец приближается к окончательному выпуску. Предыдущие итерации уже доступны как экспериментальная функция, но в 2021 году мы ждём широкого распространения протокола. Что такое HTTP/3? Зачем выпускать его так рано после HTTP/2? Как его можно или нужно использовать? Как он влияет на производительность?

Читать дальше →

+95

SvetaUlyanchenko 13 сен 2021 в 12:55

Доступ разрешён: Вечерняя Школа Kubernetes для разработчиков

3 мин

12K

Блог компании Слёрм

1 октября начнется Вечерняя Школа Kubernetes для разработчиков от Слёрма при поддержке Mail Cloud Solutions и Intel. 24 онлайн-лекции и 22 практические работы в кластере MCS, и все это бесплатно.

Научим использовать преимущества и учитывать ограничения Kubernetes, поднимать инфраструктуру для тестирования и экспериментов, выкатывать и эксплуатировать сервис не дожидаясь команды DevOps. Сможете быстро спасти продакшн и влиять на успешность сервиса, уменьшая time-to-market.

Прочитать больше о Вечерней Школе

+15

geniyoctober 10 сен 2021 в 05:19

Kubernetes для разработчиков: какие знания нужны?

10 мин

14K

Блог компании СлёрмKubernetes * Учебный процесс в ITУправление разработкой * IT-инфраструктура *

В преддверии запуска Вечерней школы по Kubernetes, в этот раз для разработчиков, подготовили интервью с Павлом Селивановым архитектором в Mail.ru Cloud Solutions и Марселем Ибраевым CTO Слёрма. Речь пойдет о том, какие конкретно знания нужны разработчику в компаниях с Kubernetes, Павел и Марсель поделятся кейсами из своей практики.

Читать

+19

Polina_Averina 30 авг 2021 в 06:54

Секреты observability. Часть 3: распределённая трассировка с Jaeger и OpenTelemetry

8 мин

23K

Блог компании СлёрмDevOps * IT-инфраструктура * Серверное администрирование * Системное администрирование *

Перевод

Фото Bertrand Bouchez, Unsplash.com

В прошлой статье мы с помощью Prometheus AlertManager настроили правила, чтобы отправлять уведомления через Slack при срабатывании алертов. И хотя алерты и уведомления — это удобно и полезно, сами по себе метрики не до конца объясняют проблему. Они просто показывают, что значения одного экземпляра вышли за установленные лимиты, но в распределённых системах метрики не могут отследить запрос, который проходит через несколько компонентов. С распространением микросервисов системы усложняются, поэтому мы должны проследить весь путь запроса, чтобы понять, что пошло не так. Для этого можно использовать распределённую трассировку, которая записывает действия, выполняемые в связи с запросом, и дает контекст, который мы не найдем в метриках и логах.

В этой статье мы расширим возможности observability (наблюдаемости) приложения — создадим спаны (span) и экспортируем их в распределённую опенсорс-систему Jaeger. Но сначала разберемся, что такое трейс.

Читать дальше →

+10

geniyoctober 26 авг 2021 в 10:18

Нюансы работы с PostgreSQL в 3 кейсах от DBA

9 мин

17K

Блог компании СлёрмБазы данных * Восстановление данных * SQL * PostgreSQL *

Иван Чувашов, DBA Okko и Southbridge, поделился жизненными кейсами с PostgreSQL, которые помогут решить ваши проблемы.

Разберем случаи из PostgreSQL: запросы в статусе idle in transaction, выключенные контрольные суммы данных, переполнение int4, убивающие базу временные файлы и загрузку CPU.

+20

Polina_Averina 17 авг 2021 в 12:28

Секреты observability. Часть 2: алерты

8 мин

16K

Блог компании СлёрмDevOps * IT-инфраструктура * Серверное администрирование * Системное администрирование *

Перевод

Фото Ricardo Gomez Angel, Unsplash.com

Используем метрики для отправки уведомлений через Slack

В предыдущей статье мы задеплоили оператор Prometheus с помощью helm-чарта и на примере набора сервисов увидели, как можно собирать метрики через prom-client и экспортеры. Как вы помните, цель observability (наблюдаемости) — узнать статус системы, поэтому нужные люди должны получать уведомления, когда значения метрик выходят за установленные пределы. Для этого надо настроить алерты.

Читать дальше →

+10

Polina_Averina 16 авг 2021 в 05:24

«Сайт падал на полторы минуты в сутки, но мы уже решили эту проблему». Итоги стажировки и онбординга нового инженера

6 мин

7.7K

Блог компании СлёрмСистемное администрирование * Серверное администрирование * Карьера в IT-индустрииDevOps *

Стажёрскую программу в Southbridge мы запустили три с половиной месяца назад, чтобы найти новых коллег и поделиться знаниями и опытом с теми, кому интересно развиваться в DevOps-направлении. За это время на стажировку было принято 54 начинающих инженера, большая часть из них ещё проходит программу. Первый поток завершен, в этом посте делимся итогами и историей Михаила Снеткова, который теперь работает в одной из команд Southbridge.

В первом потоке стажёрской программы участвовало девять специалистов. До конца дошло шесть. Михаил Снетков получил оффер в Southbridge, Александр Зольников — в Слёрм, еще три инженера получили офферы в другие компании во время стажировки.

Читать дальше →

geniyoctober 4 авг 2021 в 04:50

Миграция с Terraform на Terragrunt

9 мин

20K

Блог компании СлёрмСистемное администрирование * IT-инфраструктура * DevOps * Облачные сервисы *

Туториал

Перевод

В Bestmile мы используем Terraform для AWS IaC. Но чем больше развивалась наша инфраструктура, тем запутаннее становился код Terraform.

Код Terraform стало сложнее обслуживать. Он терял эффективность. Terraform — отличный инструмент, но нуждается в дополнениях. Здесь-то и пригодится Terragrunt.

Terragrunt — это обертка (wrapper) для Terraform, которая расширяет его функционал и устраняет некоторые ограничения. Terragrunt взаимодействует с Terraform с помощью кода HCL (HashiCorp Configuration Language), поэтому Terragrunt будет выполнять код Terraform в зависимости от того, как вы определите код HCL. Именно он дает дополнительные преимущества, как описано ниже, и превращает Terragrunt в волшебный инструмент.

Изучить код

Polina_Averina 28 июл 2021 в 08:28

Секреты observability. Часть 1: метрики

9 мин

18K

Блог компании СлёрмDevOps * IT-инфраструктура * Серверное администрирование * Системное администрирование *

Перевод

Фото ETA+, Unsplash.com

Первые шаги в сторону observability — собираем метрики с Prometheus

Представьте себе человека, который бьется над решением загадки, а вокруг собралось с десяток советчиков, которые помогают ему «найти убийцу». Знакомая ситуация? В таких случаях возникает больше вопросов, чем ответов, и если отвечать на все эти вопросы, ни на что другое времени уже не останется.

Сложно найти то, чего не знаешь и не понимаешь. Вот тут-то на помощь и приходит observability (наблюдаемость). Она помогает понять, что сломалось или плохо работает, и даже позволяет найти причину, чтобы вы могли постоянно вносить улучшения.

Что такое observability

Под observability мы подразумеваем показатель того, насколько эффективно можно определить внутреннее состояние системы по ее выходным данным (телеметрии). Ничего нового в этом нет — мы пытаемся разобраться в работе приложений по логам с начала времен, но сейчас все осложняется облаками, контейнерами, микросервисами, многоязычными средами и т. д.

Три кита observability

Observability основана на трех главных компонентах. Это данные телеметрии, которые можно агрегировать и анализировать, чтобы понять состояние системы:

Метрики.
Трассировки.
Логи.

В этой серии статей мы рассмотрим все три компонента с примерами. Начнем с метрик и опенсорс-проекта Prometheus.

Читать дальше →

geniyoctober 23 июл 2021 в 06:00

Пишем первый плейбук Ansible

10 мин

84K

Блог компании СлёрмСерверное администрирование * Nginx * Системное администрирование *

Туториал

Статья подготовлена на основе уроков из открытой темы "Установка LEMP стека с помощью Ansible" курса по Ansible от Слёрм. Автор – Всеволод Севостьянов, Lead Engineer в Vene.io (Affiliate marketing solution). Первые две темы курса доступны на Youtube.

Материал этого урока будет интересен тем, кто разобрался с установкой Ansible и готов написать свой первый плейбук. Результатом будет плейбук, устанавливающий nginx на удалённой машине.

+13

1 2 ...

16 17

19 20 ...

44 45

Добро пожаловать в Зольни: как из стажировки Southbridge появилась новая компания

История внедрения SRE в Dodo Engineering

HTTP/3: развёртывание HTTP/3 на практике. Часть 3

Как настроить Jenkins в связке с Ansible

Дыры и заборы в Kubernetes: кейсы взлома, советы как защитить свой кластер и рассказ о первых хакерах

HTTP/3: улучшения производительности. Часть 2

Как взглянуть на Kubernetes с другой стороны? Рассказывает Марсель Ибраев, CTO учебного центра Слёрм

Кто такой DevOps и почему это не то, что нам обещали

Как я написал свой ChatOps: опыт выпускника курса по Python

Опыт работы с Apache Kafka: интервью с inDriver

HTTP/3 от А до Я: основные концепции. Часть 1

Доступ разрешён: Вечерняя Школа Kubernetes для разработчиков

Kubernetes для разработчиков: какие знания нужны?

Секреты observability. Часть 3: распределённая трассировка с Jaeger и OpenTelemetry

Ближайшие события

Нюансы работы с PostgreSQL в 3 кейсах от DBA

Секреты observability. Часть 2: алерты

Используем метрики для отправки уведомлений через Slack

«Сайт падал на полторы минуты в сутки, но мы уже решили эту проблему». Итоги стажировки и онбординга нового инженера

Миграция с Terraform на Terragrunt

Секреты observability. Часть 1: метрики

Первые шаги в сторону observability — собираем метрики с Prometheus

Что такое observability

Три кита observability

Пишем первый плейбук Ansible

Информация