Статьи / Профиль geniyoctober / Хабр

Евгений@geniyoctober

Пользователь

ПрофильСтатьи29ПостыНовости28Комментарии46

@geniyoctober 11 сен в 08:30

Практические кейсы применения нового модуля «СХД» в DCImanager: от проблем к решениям

7 мин

4.6K

Блог компании ISPsystemIT-инфраструктура * Хранение данных * Анализ и проектирование систем *

В этой статье мы рассмотрим 8 практических кейсов, основанных на реальных проблемах, с которыми сталкиваются администраторы систем хранения данных, и покажем, как модуль «СХД» DCImanager мог бы их решить. Каждый кейс демонстрирует конкретные возможности модуля и объясняет механизм решения проблемы.

@geniyoctober 9 июн в 15:00

VMmanager, управление инфраструктурой через VMmanager API и Ansible

Средний

15 мин

1.5K

Блог компании ISPsystemIT-инфраструктура * Программирование * Виртуализация *

Привет, Хабр! Статья будет посвящена любимому мной IaC. Чтобы ввести в курс дела, кратко расскажу про VMmanager и текущую реализацию продукта. Затронем варианты, как можно работать с VMmanager с подходом Infrastructure as Code, а основная часть — про развертывание платформы VMmanager и управление виртуальными машинами в ней с помощью Ansible.

@geniyoctober 17 ноя 2022 в 07:31

Сломать контроль ресурсов в контрольных группах Linux. Часть 2

7 мин

3.2K

Блог компании СлёрмLinux * Базы данных * IT-инфраструктура * Настройка Linux *

В предыдущей публикации мы рассмотрели, как организованы контрольные группы и почему их наследование не всегда гарантирует справедливый учёт ресурсов. Также успели проанализировать один из сценариев, при котором «вредоносные» контейнеры потребляют больше ресурсов, чем разрешено. В этой статье разберёмся с оставшимися сценариями и обсудим, как решать проблемы безопасности, возникающие из-за недостатков механизма cgroups.

+14

@geniyoctober 14 ноя 2022 в 08:03

Kubernetes + Jenkins: как использовать вместе

7 мин

14K

Блог компании СлёрмСистемное администрирование * IT-инфраструктура * DevOps * Kubernetes *

Из-за роста инстансов Jenkins команда может страдать от избыточного потребления ресурсов и медлительности конвейера доставки. Выход из этой ситуации — масштабирование. В статье пошагово разбираем, как масштабировать Jenkins с помощью Kubernetes.

+15

@geniyoctober 8 ноя 2022 в 16:21

Сломать контроль ресурсов в контрольных группах Linux. Часть 1

9 мин

5.1K

Блог компании СлёрмDevOps * Linux * IT-инфраструктура * Настройка Linux *

Контрольные группы или cgroups — основные строительные блоки, обеспечивающие контейнеризацию на уровне операционной системы. Подобно процессам они организованы иерархически, и дочерние группы наследуют атрибуты родительских. В этой статье мы покажем, что наследование контрольных групп не всегда гарантирует последовательный и справедливый учёт ресурсов. Опишем стратегии, позволяющие избежать контроля использования ресурсов, и разберём основные причины, почему контрольные группы не могут отслеживать потребляемые ресурсы. Дополнительно исследуем сценарии, как вредоносные контейнеры могут потреблять больше ресурсов, чем разрешено.

+17

@geniyoctober 9 фев 2022 в 11:26

GitOps с GitLab: CI/CD Tunnel

5 мин

8.6K

Блог компании СлёрмIT-инфраструктура * Системы сборки * DevOps *

Перевод

GitLab можно использовать как первоклассный инструмент GitOps, и здесь мы покажем как. Это пятое практическое руководство из серии, посвящённой разным задачам пользователей, включая подготовку базовой инфраструктуры, управление ей и развёртывание поверх неё различных сторонних и кастомных приложений.

Здесь мы посмотрим, как получить доступ к кластеру Kubernetes с помощью GitLab CI/CD и зачем это нужно, если вы взяли курс на GitOps.

+10

@geniyoctober 3 фев 2022 в 07:58

Как связан CI/CD и правила бережливого производства

4 мин

4.8K

Блог компании СлёрмDevOps * IT-инфраструктура * Программирование * Веб-разработка *

У терминов, которые мы используем в процессах CI/CD, много общего с терминами из фабричного производства. Например, пайплайн — его наиболее близкий литературный перевод «производственная линия» и это не случайно: лучшие подходы разработки ПО похожи на подходы фабричного производства.

Эта статья — адаптированный урок Тимофея Ларкина, ведущего инженера X5 Retail Group, «Принципы работы CI и CD» курса по CI/CD. В ней мы расскажем про то, через какие боли проходят те, кто делает софт, как помогают правила бережливого производства, и какие шаги включить в пайплайн, чтобы 20% усилий дали 80% результата.

Изучить

@geniyoctober 28 янв 2022 в 05:50

CI/CD в геймдеве. Интервью с Александром Наливайко

9 мин

6.3K

Блог компании СлёрмDevOps * Развитие стартапаРазработка игр * IT-инфраструктура *

Один амбициозный и смелый парень, которого зовут Саша, настолько вдохновился практикой CI/CD в работе, что готов всем вещать, что за ней будущее. Вдохновились и мы: провели интервью и расспросили об опыте внедрения этой практики, о том, почему же CI/CD точно будет инструментом будущего и курсе Слёрм по CI/CD, который Саша изучал.

Читать о CI/CD в геймдеве

@geniyoctober 19 янв 2022 в 06:00

Пишем свои модули для Ansible на Python

27 мин

23K

Блог компании СлёрмPython * Базы данных * DevOps *

Для жаждующих знаний и прогресса собрали материал из урока Дениса Наумова, спикера курсов Ansible и Python для инженеров. Немного разберёмся с теорией и посмотрим как написать модуль для создания пользователей в базе данных.

Материал объёмный. Рекомендуем сразу открыть итоговый код файла clickhouse.py для удобной работы со статьей.

+17

@geniyoctober 29 ноя 2021 в 07:00

Мой путь в SRE

8 мин

6.3K

Блог компании СлёрмУдалённая работаIT-компанииDevOps * Карьера в IT-индустрии

Артем Артемьев, Lead SRE в компании Tango Me, повидал разный SRE. Прорабатывая программу четвёртого интенсива Слёрм «SRE: внедряем DevOps от Google», мы решили провести ещё и открытое интервью с Артемом. Он пошагово и обстоятельно делится своим 12-летним опытом в этой сфере, не скрывая трудностей и открыто говоря о требованиях к кандидатам.

Когда SRE один, а в каждой компании его воспринимают и используют по-разному, возникает множество вопросов и сомнений. Артем развеял большую часть из них, приведя личные примеры и комментируя каждый из них.

+16

@geniyoctober 24 ноя 2021 в 07:04

Обязанности SRE-инженера в зарубежных вакансиях

5 мин

32K

Блог компании СлёрмУдалённая работаIT-компанииDevOps * Карьера в IT-индустрии

Перевод

В 2016 году Google выпустила ту самую книгу о SRE (Site Reliability Engineering). Эта практика решала важную задачу компании — поддержание высокой надёжности сервисов Google. За годы практика широко распространилась среди разработчиков по всему миру. Теперь во многих стартапах и крупных корпорациях есть должность SRE-инженера.

Практика относительно новая, так что пока не совсем понятно, что конкретно должны делать SRE-инженеры. Можно, конечно, почитать книжки или посмотреть видео, но полный список должностных обязанностей по ним не составишь.

Мы решили проанализировать 30 объявлений о вакансиях SRE-инженеров в Google, Twitter, Slack и т. д.

Читать перевод

+10

@geniyoctober 23 ноя 2021 в 06:00

Добро пожаловать в Зольни: как из стажировки Southbridge появилась новая компания

5 мин

1.8K

Блог компании СлёрмСистемное администрирование * Карьера в IT-индустрииDevOps * IT-компании

С апреля 2021 года в Southbridge проходит стажировка для тех, кто хочет стать DevOps-инженером. За полгода мы запустили 6 потоков, в которых поучаствовало больше 80 человек. На старте планировали, что проект поможет нам подготовить DevOps-специалистов для себя. Оказалось, стажировка — отличная площадка для экспериментов, которые приводят к неожиданным результатам. Например, мы не ожидали, что из стажировки появится новая компания Зольни.

В статье рассказываем, какие идеи по развитию стажёрской программы у нас были, а также объясняем, что такое Зольни.

+14

@geniyoctober 16 ноя 2021 в 13:06

История внедрения SRE в Dodo Engineering

10 мин

6.6K

Блог компании Dodo EngineeringБлог компании СлёрмDevOps * Управление разработкой * IT-инфраструктура *

Татьяна Гребенюкова, продакт-оунер курса Слёрм «SRE: внедряем DevOps от Google», собирает интересные кейсы внедрения SRE в российских компаниях. Некоторые истории мы используем для развития курса, а другими рады поделиться со всеми.

Сергей Бухаров, SRE из Dodo Engineering, рассказал историю внедрения SRE в компании, какие практики из книжек оказались неприменимы и из чего состоят будни SRE-команды.

+19

@geniyoctober 14 окт 2021 в 14:40

Как взглянуть на Kubernetes с другой стороны? Рассказывает Марсель Ибраев, CTO учебного центра Слёрм

3 мин

3.2K

Блог компании Слёрм

18 октября на образовательной онлайн платформе Слёрм стартует новый курс: Мега – поток по популярной платформе оркестрации контейнеров с открытым исходным кодом Kubernetes. Программа курса максимально широкая – чуть более, чем за месяц участники освоят 12 тем, связанных с разворачиванием отказоустойчивого кластера и решением продвинутых задач по обеспечению стабильности и безопасности кластера и деплою приложений, узнают как Kubernetes работает изнутри, разберутся с тонкостями установки и конфигурации кластера и получат незаменимые практические навыки обращения с инфраструктурой.

+10

@geniyoctober 10 сен 2021 в 05:19

Kubernetes для разработчиков: какие знания нужны?

10 мин

15K

Блог компании СлёрмKubernetes * Учебный процесс в ITУправление разработкой * IT-инфраструктура *

В преддверии запуска Вечерней школы по Kubernetes, в этот раз для разработчиков, подготовили интервью с Павлом Селивановым архитектором в Mail.ru Cloud Solutions и Марселем Ибраевым CTO Слёрма. Речь пойдет о том, какие конкретно знания нужны разработчику в компаниях с Kubernetes, Павел и Марсель поделятся кейсами из своей практики.

Читать

+19

@geniyoctober 26 авг 2021 в 10:18

Нюансы работы с PostgreSQL в 3 кейсах от DBA

9 мин

21K

Блог компании СлёрмБазы данных * Восстановление данных * SQL * PostgreSQL *

Иван Чувашов, DBA Okko и Southbridge, поделился жизненными кейсами с PostgreSQL, которые помогут решить ваши проблемы.

Разберем случаи из PostgreSQL: запросы в статусе idle in transaction, выключенные контрольные суммы данных, переполнение int4, убивающие базу временные файлы и загрузку CPU.

+20

@geniyoctober 4 авг 2021 в 04:50

Миграция с Terraform на Terragrunt

9 мин

22K

Блог компании СлёрмСистемное администрирование * IT-инфраструктура * DevOps * Облачные сервисы *

Туториал

Перевод

В Bestmile мы используем Terraform для AWS IaC. Но чем больше развивалась наша инфраструктура, тем запутаннее становился код Terraform.

Код Terraform стало сложнее обслуживать. Он терял эффективность. Terraform — отличный инструмент, но нуждается в дополнениях. Здесь-то и пригодится Terragrunt.

Terragrunt — это обертка (wrapper) для Terraform, которая расширяет его функционал и устраняет некоторые ограничения. Terragrunt взаимодействует с Terraform с помощью кода HCL (HashiCorp Configuration Language), поэтому Terragrunt будет выполнять код Terraform в зависимости от того, как вы определите код HCL. Именно он дает дополнительные преимущества, как описано ниже, и превращает Terragrunt в волшебный инструмент.

Изучить код

@geniyoctober 23 июл 2021 в 06:00

Пишем первый плейбук Ansible

10 мин

102K

Блог компании СлёрмСерверное администрирование * Nginx * Системное администрирование *

Туториал

Статья подготовлена на основе уроков из открытой темы "Установка LEMP стека с помощью Ansible" курса по Ansible от Слёрм. Автор – Всеволод Севостьянов, Lead Engineer в Vene.io (Affiliate marketing solution). Первые две темы курса доступны на Youtube.

Материал этого урока будет интересен тем, кто разобрался с установкой Ansible и готов написать свой первый плейбук. Результатом будет плейбук, устанавливающий nginx на удалённой машине.

+13

@geniyoctober 30 июн 2021 в 06:00

Зачем инженеру эксплуатации знать Python: три кейса из практики

8 мин

9.5K

Блог компании СлёрмDevOps * IT-инфраструктура * Python * Системное администрирование *

7 июня наша команда запустила для 90 участников первый поток курса по Python, созданного специально для инженеров эксплуатации и системных администраторов. Там разбираем админские библиотеки, пишем операторы и модули, настраиваем интеграции, а в конце каждый студент напишет свой проект и получит код-ревью.

Анонсируя второй поток, который стартует 11 октября, делимся историей Артёма Чекунова, Senior DevOps Engineer в Chartboost. Артём рассказывает, как познакомился с Python, и описывает несколько реальных кейсов его применения: для анализа потребления ресурсов в облаке и bare-metal, сборки тяжелого софта, мониторинга серверов Elasticsearch.

Читать дальше →

@geniyoctober 24 июн 2021 в 06:00

Что такое service mesh, когда внедрять, альтернативы Istio и другие ответы экспертов с АМА-сессии Слёрм по service mesh

18 мин

6.4K

Блог компании СлёрмСистемное администрирование * Микросервисы * Kubernetes * DevOps *

Публикуем сессию вопросов и ответов по service mesh. Сессия прошла в рамках подготовки к интенсиву Слёрм по service mesh. На Youtube есть запись.

Эксперты отвечали на самые популярные вопросы по технологии service mesh и вопросы участников мероприятия. Ключевые вопросы АМА-сессии:

Что такое service mesh,
Когда внедрять,
Альтернативы Istio,
Почему Envoy используется в service mesh, а не Nginx.

Марсель Ибраев, СТО Слёрм, вёл мероприятие, а Александр Лукьянченко, тимлид в команде архитектуры Авито, и Иван Круглов, Staff Software Engineer в Databricks, делились экспертизой.
Оба инженера имеют опыт не просто с работы какой-то конкретной реализацией service mesh, но с построением собственного, что намного круче.

Читать дальше →