Как стать автором
Поиск
Написать публикацию
Обновить
83.38
Слёрм
Учебный центр для тех, кто работает в IT
Сначала показывать

Александр Довнар о CI/CD: как, зачем, для чего

Время на прочтение14 мин
Количество просмотров12K

Спикер курса «CI/CD на примере Gitlab CI», Lead DevOps в Naviteq (ex. Onesoil and EPAM) Александр Довнар, рассказывает про CI, CD и еще раз CD.

Александр — AWS Community builder и сертифицированный архитектор, соведущий подкаста DevOps Kitchen Talks. 11+ лет работает в IT и сетях, из них 7+ лет — в Devops.

Эта статья — расшифровка вебинара, где Александр рассказывает, что за зверь CI/CD, кому и когда он нужен и зачем применять его в команде, а также обсуждает текущие проблемы индустрии вокруг этой практики.

Читать далее

От wtf-кода к чистой архитектуре

Время на прочтение13 мин
Количество просмотров15K

Материал заботливо подготовлен на основе перевода части книги Go With The Domain, а именно — главы 9 «Чистая архитектура» за авторством Miłosz Smółka.

В этой части говорится о том, как из wtf-кода прийти к чистой архитектуре с помощью сочетания двух идей: разделении портов и адаптеров + ограничении того, как структуры кода ссылаются друг на друга.

Читать далее

Очередь недоставленных сообщений для обработки ошибок в Apache Kafka

Время на прочтение12 мин
Количество просмотров25K

Любому надёжному конвейеру потоковой обработки данных нужны механизмы обнаружения и обработки ошибок. В этой статье вы узнаете, как реализовать обработку ошибок с помощью очереди недоставленных сообщений (Dead Letter Queue) в инфраструктуре Apache Kafka.

Мы рассмотрим несколько вариантов: кастомная реализация, Kafka Streams, Kafka Connect, Spring Framework и Parallel Consumer. Вы увидите, как Uber, CrowdStrike и Santander Bank реализуют надёжные механизмы обработки ошибок в реальном времени и в огромном масштабе.

Читать далее

Внедрять или не внедрять. Развеиваем главные мифы о SRE

Время на прочтение6 мин
Количество просмотров2.3K

Site Reliability Engineering (SRE) пришел в компании, чтобы прорабатывать вопросы надежности целиком всей системы без разделения на отдельные зоны ответственности, как это было при работе сисадминов и программистов до появления DevOps'ов. Однако роль SRE-инженера, которую представил Google, каждый стал трактовать по-своему. Кто-то делал все строго по книге, а кто-то добавил в работу и свое личное видение.  

Со временем обязанности SRE в компаниях, особенно на российском рынке, стали отличаться друг от друга. Вместе с тем появились сопутствующие вопросов о внедрении, обучении сотрудников, применении тех или иных инструментов и тд.

В этой статье мы собрали самые часто встречаемые мифы и вопросы о внедрении SRE и обучении его инструментам. Ответить на них нам помог Максим Гусев, Tech Lead SRE, на счету которого тысячи выстроенных пайплайнов CI/CD и более 100 инсталляций Kubernetes в продакшен.

Читать далее

Система управления конфигурацией Ansible: как одновременно управлять множеством серверов

Время на прочтение6 мин
Количество просмотров11K

Представьте, что вам требуется управлять множеством серверов, расположенных в различных точках земного шара. Каждое устройство нужно настроить, обновлять ПО и мониторить.

Можно делать это руками, подключаясь к каждому отдельно, но это не наш метод. О том, что выбираем мы, поговорим в этой статье.

Читать далее

Безопасный Spring REST с применением Spring Security и OAuth2

Время на прочтение12 мин
Количество просмотров29K

В этой статье мы продемонстрируем пример настройки Spring Security + OAuth2  для защиты конечных точек REST API на фреймворке Spring Boot. Клиенты и учетные данные пользователей будут храниться в реляционной базе данных (для баз данных H2 и PostgreSQL подготовлены примеры конфигураций).

Читать далее

От кодинга до крупных конференций: где искать темы для выступлений и зачем это нужно

Время на прочтение7 мин
Количество просмотров1.6K

Выступления с техническими докладами могут многое дать как спикерам, так и бизнесу. На конференциях можно решить сразу ряд задач: встретить единомышленников, найти интересные проекты, повысить имидж компании и даже решить рекрутинговые вопросы. Несмотря на это, многие IT-компании и специалисты игнорируют такую возможность из-за отсутствия тем для выступления.

В этой статье мы рассказываем, с каких углов можно посмотреть на свою работу, чтобы разглядеть в ней зерно для будущего выступления. Также здесь вы найдете рекомендации, как сделать технический доклад интересным для слушателей.

Читать далее

Модульное тестирование операторов Kubernetes с помощью моков

Время на прочтение4 мин
Количество просмотров2.7K

Из этой статьи вы узнаете, зачем нужны моки для модульного тестирования операторов Kubernetes и как их писать. Эти концепции применимы к операторам на разных языках и фреймворках. Здесь мы будем использовать Golang, controller-runtime и библиотеку testify.

Читать далее

Пять инструментов Site Reliability Engineering

Время на прочтение6 мин
Количество просмотров8.7K

Надежность (reliability) программного продукта всегда является одним из приоритетов компании. Особенно это актуально для ПО, превратившегося в ежедневный инструмент для своих пользователей. Они рассчитывают на заявленный функционал, поэтому любая невозможность его использования подрывает доверие, а следовательно, и желание им пользоваться.

В этой статье пойдет речь о главных инструментах Site Reliability Engineering (SRE) и о том, как они влияют на повышение надежности систем. 

Читать далее

Плейбуки Ansible — советы и примеры

Время на прочтение12 мин
Количество просмотров91K

В этой статье мы рассмотрим плейбуки Ansible — схемы для действий по автоматизации. Плейбуки — это простой, целостный и воспроизводимый способ определить все действия, которые мы хотели бы автоматизировать.

Читать далее

На грани между ИТ и ИБ: противоборство или союз специалистов?

Время на прочтение13 мин
Количество просмотров7.1K

В среде разработчиков бытует мнение, что информационная безопасность относится к IT не напрямую, а косвенно, что это вспомогательная область и даже вторичная. Но так ли это на самом деле? На этот неоднозначный вопрос серьезно и обстоятельно ответили спикер Слёрма Роман Панин и его коллега Павел Шатилов, руководители направления архитектуры ИБ в МТС.

Читать дальше

Apache Kafka в цепочке поставок в пищепроме и ритейле

Время на прочтение9 мин
Количество просмотров7.7K

Цепочка поставок в пищевой промышленности и ритейле — это сложная, медленная и ненадёжная система. В этой статье мы рассмотрим развёртывание Apache Kafka для обработки данных в реальном времени в таких сферах, как производство, логистика, розничная торговля, доставка, рестораны и другие части бизнеса. Это будут примеры из настоящих компаний: Walmart, Albertsons, Instacart, Domino’s Pizza, Migros и т. д.

Читать дальше

10 рекомендаций по работе с Ansible

Время на прочтение6 мин
Количество просмотров12K

Ansible — топовое решение для управления парком геораспределенных серверов и позволяет конфигурировать нужные состояния с помощью кода. Но даже несмотря на популярность решения, в том числе среди российских разработчиков, не все знают, как оптимизировать работу с этим инструментом, из-за чего вынуждены работать с «костылями».  

Делимся советами, как «выжать» из Ansible по-максимуму, не сталкиваясь с проблемами.

Читать далее

5 типичных ошибок при использовании Apache Kafka

Время на прочтение10 мин
Количество просмотров28K

Даже если у вас большой опыт работы с Apache Kafka, время от времени наверняка случается зайти в тупик. Например, когда вы конфигурируете и изучаете клиенты или настраиваете и отслеживаете брокеры. Попробуй за всем уследить, когда в конвейере Kafka столько компонентов. В этой статье описано пять частых ошибок и советы по тому, как их избежать на всех этапах — от конфигурирования клиентов и брокеров до планирования  и мониторинга. Эти рекомендации сэкономят вам время и силы.

Читать далее

Ближайшие события

Применяем политики и рекомендации по безопасности в кластерах Kubernetes с OPA Gatekeeper

Время на прочтение5 мин
Количество просмотров3.5K

Представим, что мы маленькая компания. Мы хотим перенести рабочие нагрузки в Kubernetes, но нас очень волнует вопрос безопасности. Мы уже создали кластеры, опираясь на рекомендации по безопасности из официальной документации Kubernetes. Бизнес растёт, и нам нужно что-то изменить, чтобы защитить среду Kubernetes и в то же время управлять действиями конечных пользователей в кластере. Мы используем встроенные возможности Kubernetes, вроде управления доступом на основе ролей (RBAC), политик безопасности pod’ов, политик сети, управления secret’ами и т. д.

В какой-то момент мы понимаем, что нам нужны более детальные настройки. Например, мы хотим запретить развёртывание pod’ов, если образ поступает из ненадёжного реестра. Встроенных функций нам уже не хватает, и мы начинаем обдумывать собственные политики, удовлетворяющие нашим требованиям.

Допустим, мы сформулировали политики. Как теперь легко и быстро применить их в среде Kubernetes? В статье мы ответим на этот вопрос.

Читать далее

Как мониторить золотые сигналы SRE

Время на прочтение6 мин
Количество просмотров9.7K

Принципы Site Reliability Engineering (SRE) в последнее время очень популярны, отчасти благодаря знаменитой книге о SRE в Google, где говорится о золотых сигналах, за которыми нужно следить, чтобы наши системы работали быстро и безотказно в любых масштабах.

Все понимают, что это важные сигналы, но не все знают, как их отслеживать. Об этом всем мы расскажем в данной статье.

Читать далее

Куда катится девопс: о чём говорили на круглом столе в Слёрме

Время на прочтение6 мин
Количество просмотров3.7K

Девопс есть во многих компаниях, но он везде разный. Чтобы понять, что происходит в отрасли, какие есть тренды и какие компетенции будут востребованы, мы провели круглый стол с экспертами. Обсуждаем, где девопс сейчас, каковы тенденции и чего ждать компаниям и девопс-инженерам в будущем.

Эта статья — краткий конспект круглого стола «Куда катится девопс». Если не хотите читать, можно посмотреть запись.

Спикеры ответят на пять вопросов о девопсе. Где-то их мнения совпадут, где-то нет — выводы для себя делайте сами.

Читать дальше

Зачем Слёрму ещё один курс по Linux?

Время на прочтение4 мин
Количество просмотров2.9K

3 октября в Слёрме стартует второй поток «Администрирование Linux Мега». Это практический курс, основанный на опыте инженеров Southbridge. Его цель — познакомить студентов с best practices Linux и посмотреть в глубину работы с этой ОС. 

Мы провели интервью с директором курса Евгением Бутыриным. Он рассказал, кому будет полезно обучение на «Linux Мега», как создавался курс и в чём хардовость итоговой сертификации.

Читать далее

Четыре важных теста для Apache Kafka CI/CD с GitHub Actions

Время на прочтение9 мин
Количество просмотров2.8K

Если вы используете GitHub для создания приложений Apache Kafka®, наверняка вы захотите интегрировать Kafka в свою среду разработки и эксплуатации GitOps. Эта статья для тех, кто понимает принципы GitOps, ценность непрерывной интеграции и поставки (CI/CD) и важность промежуточных сред (staging).

Мы поговорим о том, как применять принципы GitOps к жизненному циклу разработки клиентского приложения Kafka с помощью GitHub Actions — для тестирования в локальной среде и Confluent Cloud, со Schema Registry и без него, и для эволюции схемы.

Читать далее

Интеграция Open Policy Agent (OPA) в Kubernetes

Время на прочтение14 мин
Количество просмотров4K

OPA можно интегрировать практически куда угодно, включая Kubernetes. Из этого материала вы узнаете, как интегрировать OPA в Kubernetes, и на примерах рассмотрите преимущества этой интеграции. В Kubernetes мы развертываем OPA как контроллер доступа. 

Читать далее

Информация

Сайт
to.slurm.io
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия
Представитель
Антон Скобин