Какие доклады должны быть на конференции про девопс? Ведь для тех, кто связан с девопсом, важны и культура взаимодействия разных специалистов, и инструменты вроде Kubernetes, и вопросы вроде безопасности, и облака, и много чего ещё… Что из этого освещать на мероприятии?
Наш ответ такой: всё. Поскольку ближайшая конференция DevOops будет аж четырёхдневной, там найдётся время на все эти темы. А поскольку она будет полуофлайновой-полуонлайновой, то это «всё» будет ещё и «везде»: можно хоть лично прийти на московскую площадку, хоть подключиться удалённо.
Сейчас программа уже составлена, и представляем Хабру описания всех докладов.
Оглавление
Developer experience
Коктейль из сред. Как смешать тестовые среды и среды разработчиков и остаться в живых
Александр Тарасов
Обычно в компаниях есть четкое разделение между средами для тестирования и средами для разработки. Но что, если пойти другим путем и смешать все в одну среду и остаться при этом в живых? Александр разберет способы организации облачных сред для тестирования и разработки, сравнит их между собой и расскажет о плюсах и минусах совмещенного подхода.
Andres Sacco
TravelX
Каждая компания использует набор инструментов для разработки своих приложений; у каждого могут быть свои имена или префиксы в зависимости от устройства, поэтому требуется время на то, чтобы запомнить их или составить какую-то ментальную карту. Каждому разработчику приходится запоминать множество ссылок, так почему бы не хранить всю информацию в одном месте?
Управление TLS-сертификатами в инфраструктуре
Дмитрий Рыбалка
СберМаркет
Тема, с которой сталкивается каждый инженер IT-инфраструктуры — управление TLS-сертификатами. С этим вопросом многие инженеры сталкиваются в начале карьеры или повсеместно в процессе эксплуатации своей инфраструктуры. В докладе разберем рабочие кейсы в среде Kubernetes с подробным описанием тулинга. Обязательно будут нюансы и лайфхаки. В большой компании без ИБ никуда, поэтому вопрос безопасности также будет освещен, как изнутри, так и снаружи... Реальный опыт компании СберМаркет. Самые сложные моменты развития и самые точные решения.
Как мы строили платформу на базе Kubernetes и старались не скатиться в «кубер с аутентификацией»
Иван Кушневский
Газпромбанк
В Газпромбанке происходит трансформация в сторону продуктовой разработки, текущие процессы выделения ресурсов рассчитаны на крупные проекты, а не на небольшие продуктовые команды. Одним из средств технического обеспечения этой трансформации должен был стать OpenShift. Миграция на OpenShift оказалась очень трудной и никак не помогла командам в переходе на продуктовую разработку.
Теперь еще встал вопрос импортозамещения. Ивану как техлиду была поставлена задача по созданию платформы на базе Kubernetes, которая будет помогать трансформации и импортозаместит OpenShift. Команда разработала архитектуру будущей платформы, проработала аспекты безопасности и набор сервисов из коробки. Разработали автоматизацию и процессы по доступу к платформе и совместной работе пользователей.
Технологии: Kubernetes, Cilium (with eBPF), Istio service mesh, Tyk Gateway API, Teleport, GoLang, Ansible, ArgoCD.
Целевая аудитория: DevOps-инженеры, системные администраторы, AppSec, технические директора.
Один пайплайн, чтобы править всеми!
Евгений Харченко
Райффайзен Банк
Евгений покажет, как с помощью одного пайплайна можно заниматься шерингом экспертизы, ускорять команды, а также внедрять DevOps-практики в команды. Доклад решает проблему переиспользования наработок в организации и выстраивания внутреннего InnerSource-процесса. Но и это не всё. Когда мы говорим о коллективных решениях, то большая сложность заключается в том, как построить общее решение, которое бы подошло большому количеству команд. Евгений ответит и на этот вопрос.
Любовь. Ненависть. Nexus Repository Manager
Дмитрий Афанасьев
Контур
Дмитрий поделится своим опытом эксплуатации и администрирования NXRM в его бесплатной версии. Вы узнаете, какие у него есть плюсы, чем он хорош и кому может быть полезен. А во второй части услышите о его минусах, проблемах и подводных камнях и историях из жизни. Как справлялись с вечным Grabage Collector, как чинили абсолютно непонятную проблему и что к этим приключениям привело.
Наш путь: выбор и принятие APIM Gravitee
Никита Михайлов
Передовые Платежные Решения
Внедрение новых инструментов — это всегда приключение. Самый сложный вопрос — «А что нас ожидает в пути?»
Никита расскажет их историю внедрения API Managment-платформы Gravitee. В 2022 году им потребовалась система API Gateway. Задача была провести анализ доступных решений и внедрить одно из них. Он поделится выводами из анализа и расскажет, с чем они столкнулись при развертывании. Инфраструктура, архитектура, процессы, подводные камни, планы — все этапы развития их понимания платформы.
Алексей Горбов
Тинькофф
Apache Cassandra – это нереляционная отказоустойчивая распределенная СУБД, рассчитанная на создание высокомасштабируемых и надежных хранилищ огромных массивов данных. В Тинькофф активно используют Apache Cassandra. У них есть несколько десятков кластеров, в которых хранятся сотни терабайт данных и которые обрабатывают сотни тысяч запросов в секунду.
Алексей опишет их путь от идеи до получения нужной базы Cassandra по кнопке. Почему они выбрали решение на базе Kubernetes и с какими проблемами сталкивались. Что получилось в итоге, а что не удалось реализовать. Он расскажет, как они писали обвязку и почему пришлось писать свой оператор. Вы узнаете, почему сервис — это не только получение базы по кнопке, но целый комплекс мероприятий.
Практическое применение dev-контейнеров
Дмитрий Стародубцев
Tourmaline Core
Ольга Кузьмичева
Tourmaline Core
Ручная настройка инструментов разработки, компиляторов и других тулчейнов занимает много времени, особенно в большой команде. Немало времени уходит и на создание подходящей среды для тестирования приложения, если разработка ведется под другую платформу. Использование dev-контейнеров позволит упростить процесс разработки, синхронизировать необходимые настройки среды разработки между командой.
Спикеры покажут, как создать dev-контейнеры в средах разработки VS Code, Clion, Visual Studio. Они расскажут об их практическом применении на примере разработки для другой платформы. Они также опишут подходы к разделению разработки и тестирования и подход к разработке прямо на таргетной платформе.
Сергей Житинский
Git in Sky
Основа доклада — вопрос о необходимости и возможности в нынешних условиях говорить об эксплуатации и лучших практиках и стандартизации серверного ПО в компаниях. Как показывает практика, сегодня очень редко даже в крупных компаниях существуют какие-либо стандарты для процесса эксплуатации, тогда как стандарты для разработки мы более или менее видим. Сергей предложит на обсуждение свой набор универсальных стандартов, основанный на лучших практиках. Методологии эксплуатации ПО VCS IaC, Ansible ELK/EFK DRP.
SRE
SRE и перформанс, или Когда производительность имеет значение
Григорий Кошелев
Контур
Доклад о том, как работа над производительностью сервиса декомпозируется на отдельные задачи. Тема включает не только перформанс-тестирование, профилирование и бенчмарки, но и проектирование метрик сервиса, связь с SLO, анализ факапов, процесс работы над оптимизацией производительности и автоматизацию в CI/CD.
Глеб Соболев
Лаборатория Касперского
Глеб рассмотрит основные принципы работы системы Thanos — мощного инструмента, позволяющего создавать высокодоступный кластер инстансов Prometheus и расширять его возможности. Он также расскажет о ее преимуществах для компаний и организаций. Спикер покажет, как Thanos помогает решить проблему ограниченного объема хранения в Prometheus, обеспечивая сохранность и доступность данных на протяжении длительного времени. Он рассмотрит механизмы, используемые Thanos для распределенного хранения данных и глобального поиска.
Вы узнаете, как настроить высокодоступный кластер инстансов Prometheus с помощью Thanos, и как эта система может помочь вам строить масштабируемое и надежное решение для мониторинга. Кроме того, он опишет функциональность долгосрочного хранилища в системе Thanos. Вы узнаете, как Thanos обеспечивает сохранность метрик на протяжении многих лет, позволяя вам проводить анализ долгосрочных трендов и вести историческую аналитику данных. Долгосрочное хранилище Thanos позволяет сохранять данные в надежной и эффективной форме, освобождая пространство в основном хранилище Prometheus.
Публичное интервью по troubleshooting для SRE-инженеров
Александр Поломодов
Тинькофф
Салих Фахрутдинов
Тинькофф
Здесь не стандартный доклад, а «публичное собеседование».
Найм SRE-инженеров можем выглядеть по-разному. В Тинькофф одно из интервью выглядит, как работа в рамках инцидента, где сценарий приблизительно таков:
По легенде кандидат и интервьюер работают совместно в SRE-команде. Кандидат исполняет роль Lead, а интервьюер — Junior.
Собственно, по той же легенде Lead уезжает на конференцию, а Junior остается дежурить.
Дальше происходит инцидент, который они вместе распутывают.
На этом публичном собеседовании мы увидим, как это выглядит.
Mobile SRE — когда надежность нужна не только на бэкендах
Даниэль Халиулин
Тинькофф
Бытует мнение, что тема SRE и надежности — это все про бэкенды, API и базы. Но чем больше мобильные приложения проникают в нашу жизнь, тем выше требования и ожидания от их надежности у нас самих и у наших клиентов. Иметь надежную серверную инфраструктуру становится недостаточно: клиентам нужны быстрые и надежные мобильные приложения.
Даниэль расскажет про то, с какими вызовами они столкнулись в теме обеспечения надежности мобильного банка — основного приложения Тинькофф. Он поделится тем, какие SRE-практики помогли сделать его надежнее, и расскажет, как и за какими техническими метриками они следят.
Доклад будет интересен инженерам, у которых в компании используются мобильные приложения. Вы получите стартовый импульс для того, чтобы начать более прицельно заниматься надежностью вашего мобильного приложения.
Умный DNS: вариации и области применения
Артем Мещеряков
GlobalDots
Артем расскажет о своем пути в область Intelligent DNS и использовании NS1 как провайдера динамически определяемых DNS-записей. Как при помощи современной DNS-системы управлять трафиком, балансируя между разными облаками и/или CDN-провайдерами и используя данные мониторинга в качестве основы принятия решения для DNS-ответа.
SRE. Неочевидные способы прострелить себе колено в попытках сделать приложение надежнее
Лев Алимов
Тинькофф
В какой-то момент каждый разработчик осознает, что нельзя положиться на надежность внешних систем. Что угодно может начать работать неожиданным образом, и надо бы соломки подложить. Тогда в приложении появляются разнообразные механизмы для страховки от отказа зависимостей: ретраи, кэши, резервирование и балансировка нагрузки. Но (внезапно) сама реализация этих паттернов может не только не помочь во время сбоя, но и усугубить его. Спикер расскажет, как оно бывает и что можно сделать, чтобы соломка не оказалась кучей кирпича.
Инструменты и практики SRE, которые помогают освободиться от рутины и добиться гладкой работы систем
Максим Гусев
Southbridge
В работе мы часто сталкиваемся со сложностями в применении некоторых практик SRE. Спикер расскажет о ключевых проблемах и предложит эффективные решения, которые позволят нам преодолеть эти преграды.
Какие проблемы затронет выступление:
Подход к дежурствам, описанный в SRE практике, сложно применить на своих проектах
Решение: спикер представит реальный кейс, как они адаптировали эти практики, вовлекая обычных дежурных администраторов.
У SRE много рутинных задач, и часто практика отслеживания этих задач сложная
Решение: практики выявления рутинных задач и их автоматизации. Спикер покажет, как их подходы могут значительно улучшить эффективность работы и сократить нагрузку на команду SRE.
Неподготовленность к инцидентам и хаос при работе с ними
Решение: практические решения и стратегии, которые помогут более грамотно работать с инцидентами, минимизировать время реакции и сэкономить ценные ресурсы команды SRE.
Кирилл Борисов
VK
Доклад о том, как избежать антипаттернов в Observability. Observability — это не только инструменты и технологии, но и культура и подход к разработке и эксплуатации приложений. Использование антипаттернов может привести к тому, что Observability не будет работать должным образом, и мы не сможем получить полную картину происходящего в системе.
В докладе Кирилл определит понятие антипаттерна и приведет примеры антипаттернов в Observability, таких как «Слишком много метрик», «Слишком много логов», «Слишком много алертов».
Спикер расскажет, как эти антипаттерны могут привести к перегрузке системы и затруднить анализ данных. Он также даст советы, как этого избежать.
Как внедрить SLO в продукт и получить от этого пользу
Даниил Марданов
Контур
SLO — это практика, входящая в состав SRE-методологии, которая помогает найти баланс между скоростью развития сервиса и его надежностью.
Даниил поделится опытом внедрения SLO в их продукт и расскажет, какие результаты это принесло. Он поговорит о трудностях, с которыми они сталкивались и как их преодолевали. На примере реальных графиков разберет, что на них можно увидеть и как использовать эту информацию в работе.
Cloud
Демистификация Serverless: трансформация процессов и культуры разработки
Антон Черноусов
Яндекс Облако
Понятие serverless и масса «новых» продуктов, основанных на этом подходе, сформировали кучу мифов в разработке, которые мешают трезво смотреть на serverless-разработку. В процессе демистификации выясним, разберем и развеем основные мифы, связанные с разработкой serverless-приложений. Еще раз уточним, как работает serverless-подход в разработке. Разберем основные принципы и компоненты serverless-архитектуры и событийно-ориентированного подхода. Поймем, какие процессы разработки ПО подвержены трансформациям в процессе адаптации к serverless-подходу. Уточним, как изменяется роль разработчиков. Какие DevOps-практики укореняются, и прорастает ли культура сотрудничества в командах, практикующих serverless-подход.
Эффективное управление облачной инфраструктурой
Владимир Дроздецкий
Магнит
Облака используются повсеместно. Практику Infrastructure as Code используют почти все. Пришло время разобраться, как грамотно выстроить инфраструктурную разработку. В этом докладе мы поговорим о том, как использовать Terraform и Terragrunt для организации командной разработки. Какие практики из разработки можно позаимствовать и успешно применять в инженерной разработке. Не пройдем мимо вредных советов, поговорим о типичных проблемах и как их избежать.
Переезд в Яндекс Облако с on-prem в условиях кровавого энтерпрайза
Владимир Пашковский
Магнит ИТ Лаб
Доклад о том, как Владимир с командой переезжали с корпоративного on-prem в Яндекс Облако. Весь спектр ощущений — от подготовки к переезду до финального счастья. Он поделится с вами болями миграции в контексте кровавого энтерпрайза, ресерча новых сервисов и технологий. Затем расскажет о подводных камнях, вариантах решения поступающих проблем и о том, где можно подстелить соломку, дабы падать было не так уж и больно. Технические аспекты спикер разбавит парой слов про бюджеты, амортизацию и вопрос глобального управления инфрой. Закончит он общим сравнением on-prem и облака для девопса в рамках продуктовой команды.
Пирамида потребностей multitenant-системы
Константин Малов
Яндекс
Внедряя Big Data-решение, инженеры в первую очередь обращают внимание на масштабируемость и отказоустойчивость. Это основа, фундамент большой multitenant-системы. Но по мере увеличения размера кластера, числа запросов и пользователей, узким местом может стать уже не single-master, а админ или менеджер. Чтобы команда не утонула в рутине, нужно или постоянно расширять штат поддержки, или добавлять новые свойства системы и средства автоматизации.
YTsaurus — основная платформа для хранения и обработки данных Яндекса, ad hoc-аналитики и регулярных батч-процессов. Сейчас крупнейший кластер YTsaurus — это более 20К хостов и 4.5К DAU. Этот доклад про путь автоматизации, который прошла команда YTsaurus, и получившийся набор инструментов. Ретроспективно их можно разбить на несколько уровней, выстроенных в виде пирамиды: от инженерных — к пользовательским и бизнесовым. И как в пирамиде Маслоу, переход на следующий уровень происходит тогда, когда оказываются закрыты потребности предыдущего.
One-cloud vs K8s: брать готовое или писать облако самим?
Иван Буймов
VK
Алексей Шарапов
VK
Развлекательный доклад-батл на актуальную в современных реалиях тему. Будем рассуждать на тему облаков в контексте сравнения Kubernetes и собственного решения VK — One-cloud. Обсудим, нужно ли вам писать свои продукты или лучше использовать open source, какие риски и трудности ждут вас на каждом из путей.
Опыты с IaC: как мы научились запускать зоны доступности облака за пару дней
Иван Гулаков
МТС
Доклад о том, что делать облачному бизнесу, который хочет расширяться, а затраты на развёртывание новых площадок и их обслуживание постоянно растут.
Спикер расскажет, как они написали коробочное решение, позволяющее полностью управлять жизненным циклом инфраструктуры в регионе. Единой точкой управления является менеджмент K8s-кластер, в который доставляется конфигурация всей инфраструктуры региона с помощью GitOps. Для ее последующей имплементации используется ряд самописных Kubernetes-операторов.
Узнаем, как единый инструмент управления регионом для devops/network/virtualization-команд помог им снизить T2M развертывания в 10 раз, а также значительно упростил управление инфраструктурой.
Culture
Эволюция FinOps. Как развивается FinOps в организациях?
Илья Семёнов
Cloudthread
Виталий Белясов
Align Technology
FinOps активно развивается уже более 10 лет и сегодня существует внутри компаний как отдельное функциональное направление. Спикеры расскажут о том, как меняется организационный подход и происходит постепенный shift left. На примере компании Align Technology они объяснят, зачем была создана FinOps-роль в командах разработки и какие результаты были достигнуты за 8 месяцев. Они покажут 3 компонента успеха: формирование программы, определение требований (и KPI) и необходимых инструментов. Вы узнаете о карьерном пути, связанном с управлением затратами на облачные технологии. Поговорим о том, как он развивался, что представляет собой сегодня и какие у него перспективы и риски. Как стать FinOps-специалистом, сколько эти люди зарабатывают, есть ли специальное образование, можно ли вырасти в топ-менеджмент, занимаясь FinOps и т. д.
1001 собеседование, или «Лиды, астанавитесь»
Андрей Сухоруков
Лаборатория Касперского
История про 1001 собеседование — сказка про исследование на собеседованиях, которое показало, что проблема не только в инженерах, но и в лидах, которые гораздо чаще не умеют задавать вопросы, ожидая от коллег игры на всех музыкальных инструментах сразу. В конференциях — сплошные истории успеха, благодаря которым мы породили франкенштейнов нашей философии.
Этот доклад — результат изучения своего субъективного опыта и экспериментов на собеседованиях в течение пяти долгих лет с целью ответить всего лишь на один вопрос: «Так какой же мне DevOps нужен?»
Игорь Курочкин
Enabling.team
О DevOps говорят уже больше 10 лет. Все началось в 2009 году с профессионального движения, которое решало проблему взаимодействия Dev и Ops. Игорь расскажет, какие проблемы получилось решить DevOps-движению, а какие еще предстоит. Он разберет артефакты и развитие движения: исследования и отчеты, книги и конференции, модели и подходы. Спикер также расскажет, чем занимаются основатели движения, и попробует поискать новых лидеров. Обсудим гипотезы и проблемы, которые предстоит проверить и решить, кто конкретно и как будет решать, чтобы понять, к чему готовиться и за кем следить. Рассмотрим ответвления: Platform Engineering, Developer Experience, Internal Developer Platforms, Productivity Engineering, DORA, Team Topologies, Cloud Native, SRE.
Вася, ты видишь DevOps'а? А он есть!
Василий Куценко
Почтатех
На DevOops Meetup спикер рассказал, каким видит современного DevOps. В этот раз, развивая мысль, расскажет, как они трансформируются с учетом профиля DevOps, какие модели работают, как эффективно аллоцировать людей на проекты с сильной/слабой матрицей и т.п.
Product Security Topologies: применяем фреймворк Team Topologies, чтобы забустить безопасность
Вацлав Довнар
Независимый исследователь
Спикер изложит основные концепты agile-фреймворка Team Topologies, на практических примерах покажет, как применять его для буста безопасности и решения межкомандных конфликтов.
Security
Защищаем Kubernetes при помощи StackRox — дешево, сердито, эффективно?
Георг Гаал
Zodia Markets
Небольшой обзор актуальных средств защиты Kubernetes для облачных или bare metal-инсталляций. Спикер расскажет, почему они остановились на StackRox и даст советы по его начальной настройке.
Security для бедных без ущерба для DevEx
Игорь Кудрин
Mindbox
Сколько нужно серьезных дяденек в пиджаках, чтобы сделать безопасно в компании на 250 человек? Как работать без VPN в мире remote-first? Как жить с легаси-системами и сколько денег нужно тратить на безопасность? Попробуем разобраться.
GitOps с точки зрения безопасности
Александр Сунгуров
Exness
Александр расскажет про принципы и инструменты, которые могут быть использованы для контроля безопасности и рисков, связанных с использованием laC и GitOps в компании. Современный IT-мир все чаще использует облака и сложные системы организации и развертывания приложений. Чем больше компонентов, тем сложнее контролировать безопасность инфраструктуры и приложений с помощью классических процессов.
Информация, представленная в докладе, позволит вам погрузиться в концепции обеспечения безопасности комплекса инфраструктуры. Спикер покажет пример готовой пользовательской истории, которая включает в себя создание автоматизированных процессов управления изменениями в laC.
Внедрить DevSecOps в рамках Kubernetes
Василий Кулаженков
OpsGuru
Конечная цель любой команды DevSecOps — создать безопасный продукт, который будет функционировать без сбоев, гарантируя устойчивость к атакам. Василий расскажет, как использовать Kyverno и Falco для обеспечения безопасности облачных приложений. Он также покажет, как настроить политики безопасности с Kyverno и как Falco определяет потенциальные угрозы.
Будет интересно DevOps-специалистам, разработчикам и инженерам безопасности, работающим с Kubernetes. Вы узнаете, как создать безопасный продукт, который действительно защищен от различных угроз и атак.
Прорастить или насадить? Практическое руководство по выращиванию политик безопасной разработки
Алексей Смирнов
CodeScoring
С появлением или увеличением практик безопасной разработки в организации часто возникает вопрос: «А как же построить и настроить политики так, чтобы никому не было больно?» В докладе поговорим о том, как не кошмарить разработчиков и в то же время продолжать делать свою работу, не отвлекаясь на споры и лишние реакции. Каких инцидентов можно избежать и сколько времени сэкономить, если все сделать правильно.
Как мы захотели автоматизировать Vault CE и во что его в итоге превратили
Михаил Пахомов
Лаборатория Касперского
Когда из-за пандемии разорвались цепочки поставок, в компании не смогли приобрести Enterprise-версию HashiCorp Vault, то принялись кастомизировать Community Edition (CE). Главной задачей была автоматизация: более 400 команд, в каждой по несколько типов сотрудников (разработчик, тестировщик, админ, менеджер), и каждому нужен тот доступ, который подразумевает руководитель команды. И это не учитывая создания политик для различных сервисных учеток, токенов, ролей и так далее. Все это должно создаваться практически моментально по хотелкам команды. Однако оказалось, что Vault CE дает еще массу возможностей для кастомизаций. В итоге этот инструмент стал не только автоматизированным, но еще и многопользовательским, а также значительно более эффективным хранилищем секретов.
Михаил расскажет, как они разграничили права доступа внутри сервиса и как реализовали двухфакторную аутентификацию. Как они анализируют логи для эффективности сервиса (сбор количества аутентификаций пользователей и последующая блокировка при большой активности) и для безопасности, с постоянным анализом на инъекции. А также что они сделали с unseal-ключами, и как теперь админы админят сам сервис. И кроме того — что еще намерены допилить (и уже пилят!) в CE Vault в ближайшее время.
(Не)стандартный подход к моделированию Supply Chain Attack
Вячеслав Васин
Независимый эксперт
В последнее время многие технологичные компании так или иначе сталкиваются с Supply Chain Attack. Об этом свидетельствует растущее количество различных рисков, которые были ярко продемонстрированы за последние пару лет. В докладе будет представлен обзор основных причин возникновения Supply Chain Attack и часто используемых методов и подходов для борьбы с ними. Мы обсудим вопрос, почему это связано не только с разработкой и кодом, но и с Operations Security. В рамках доклада будут продемонстрированы истории из жизни с примерами моделирования «реальных» Supply Chain Attack. Также поговорим о том, какие практики могли бы позволить их предотвратить. Этот доклад будет особенно полезен для всех, кто еще не внедрил практики для минимизации ущерба, и кто их уже опробовал на деле для борьбы с киберугрозами.
Network Policy для разработчиков: как, зачем и почему
Сергей Канибор
Luntry
Спикер расскажет, почему именно разработчикам необходимо заниматься написанием Network Policy для своих микросервисов. А также как декларативно, быстро и удобно, придерживаясь GitOps-подхода, раскатывать и отдавать ресурсы между отделами – ИТ и ИБ.
Токсичные репозитории. Что сейчас происходит с open source?
Алексей Казин
АО ГНИВЦ
От спикера: «С начала СВО в свободном программном обеспечении стали появляться различного рода protestware. В ответ на это мы начали вести реестр такого opensource».
K8s
Через тернии к Kubernetes operators
Юрий Медведев
Спикер расскажет и покажет возможность использования management Kubernetes для быстрого создания Kubernetes-кластеров. Вы также узнаете о принципах создания и возможности операторов.
Первая часть доклада посвящена постановке задачи и теории. Вторая часть — это демо конечного решения и технические аспекты.
Очумелые ручки: делаем свой Helm Chart Repository из подручных средств
Алексей Романов
IT Enduro
Kubernetes стал стандартом индустрии: он дает много преимуществ и решает много проблем. Сейчас любой уважающий себя проект разворачивается в K8s. Конечно, никто не пишет одинаковые шаблоны: все используют Helm Charts, которые позволяют, имея один шаблон, переиспользовать его под разные сервисы. Но где хранить этот шаблон? В докладе поговорим про то, как легко и просто организовать свой Helm Chart Repository и как сделать тесты и поддержку документации для наших charts.
Скрывая Kubernetes: подходы к конфигурированию
Александр Лукьянченко
Авито
За последние годы многие компании внедрили у себя Kubernetes для удобного автоматического менеджмента ресурсов, релизного цикла и получения всего необходимого для уверенного и качественного содержания production-среды. В то же время Kubernetes обладает довольно развесистыми конфигурациями и предполагает глубокое понимание сущностей, особенностей их работы, навыков отладки и полноценного тестирования. Это порождает сложности у продуктовых разработчиков. Даже при владении навыками конфигурирования, детальном понимании, как все работает под капотом, мы начинаем сталкиваться с ошибками из-за невнимательности, неверной copy-paste. Сам Kubernetes – по сути инфраструктура для построения платформ. Александр опишет их путь эволюции конфигурирования сервисов и взаимодействия разработчиков с Kubernetes, а также покажет, на каких инструментах можно реализовать те механики и подходы, к которым они пришли. Он пройдет от подхода с ручным написанием манифестов до уровня автоматизации, когда знать о Kubernetes даже не нужно.
Андрей Синицын
VK Tech
Мы все привыкли к контейнерам, как к удобному и безопасному способу запуска приложений. Настолько привыкли, что забываем, что по факту работаем в хостовой ОС. Доступ к которой вполне можно получить изнутри контейнера при определенных условиях. Рассмотрим и вживую продемонстрируем способы покинуть контейнер и получить доступ к хостовой системе. Неймспейсы, CGROUPS, правильное разграничение привилегий и вот это все.
Использование Helm без написания Helm-чартов
Руслан Гайнанов
Иннотех
Руслан прошел длинный путь по настройке пайпланов. В какой-то момент компания начала сильно расти: из одной команды разработки стало десять, количество запускаемых микросервисов резко выросло, сейчас они запускают порядка сотни проектов и несколько тысяч подов в кластере Kubernetes. Вскоре они заметили, что разработчики вместо разработки необходимой бизнес-функциональности большую часть времени проводят за созданием и отладкой Helm-чартов в своих проектах, спотыкаясь при этом об одни и те же ошибки. Именно тогда в команде поняли, что необходимо что-то менять. И направились на поиски общего решения («серебряной пули»), которое позволило бы легко создавать одинаковую конфигурацию для сборки и запуска всех сервисов.
Спикер рассмотрит особенности их пайплайнов и то, какие правила работы с GitLab CI/CD они выработали. Он разберет, почему отказались от library-чартов в пользу единого app-чарта, и как с его помощью перестали хранить шаблоны внутри каждого проекта, а позже и часть внешних зависимостей перевели на него. Он также обсудит, какие варианты смотрели и как включились в доработку одного opensource-проекта на GitHub.
7 раз отмерь, а потом переделай: как мы храним сетевые политики
Александр Кожемякин
VK
Александр и его коллега из VK Михаил Петров расскажут, как после внедрения политик они столкнулись с проблемами их понятного именования и хранения. Они поговорят о нескольких вариантах, через которые прошли, но отказались, их плюсах и минусах. Доклад будет полезен как тем, кто только начинает пользоваться сетевыми политиками, так и тем кто их активно использует и, возможно, столкнулся с такими же проблемами хранения. Вы узнаете об их текущем решении: почему это удобно, как им активно пользуются и переиспользуют политики в множестве кластеров.
Stateful в K8s, которого мы боимся
Евгений Дехтярёв
2ГИС
В 2023 году Kubernetes, с приложениями в нем, уже никого не удивит. Туда приходит трафик, который крутится между сотнями микросервисов, модифицируется, отсеивается, порождает логи и трейсы. В конечном итоге он оседает где-то в базах данных или хранилищах, которые все так же хостятся на VM/HW и деплоятся Ansible / Puppet / Terraform. Так же, как и 10 лет назад, сисадмины заходят на эти сервера по SSH и чистят логи / WAL / локальные бэкапы.
Частично в команде Евгения делают так же. Но они шагнули вперед и начали деплоить базы в K8s, где с помощью операторов и какой-то матери автоматики эти действия происходят самостоятельно, а администраторы занимаются более интересными вещами. Спикер расскажет об их опыте работы с СУБД в K8s на примере pgSQL, ClickHouse, Cassandra, Elasticsearch, Kafka, VictoriaMetrics. Особенный упор будет сделан на типы хранилищ в K8s и особенности работы с каждым из них. К чему должны быть готовы ваши СУБД или приложения при работе в K8s, и в каких случаях лучше дважды подумать, чем заезжать в K8s.
Сказка о рулевом и прорехах в пиджаке: как сломать и как защитить K8s
Лев Хакимов
Сбер
Разберем виды атак на кластер, какие основные типовые уязвимости встречаются, как с ними бороться и причем тут Admission Controller. Как настроить политики безопасности, чтобы не запретить все вокруг и не разрешить чего-то лишнего. Технологии: Kyverno, Kubernetes, сеть и сетевые протоколы, пентест.
MLOps
Олег Вознесенский
Газпромбанк
Денис Занков
Газпромбанк
MLOps — еще одно buzzword с суффиксом -ops, появившееся в последнее время. Давайте разберемся на примере департамента машинного обучения Газпромбанка, какой набор задач и технологий скрывается под этим термином. К каким вызовам нужно быть готовым системному администратору или SRE, который планирует уйти в MLOps.
Что я хотел бы знать об MLOps год назад
Миржан Иркегулов
Kolesa Group
Спикер пришел в Kolesa Group около года назад — работать в загадочном направлении MLOps. За этот год команда столкнулась с рядом неоднородных задач, на которых нет каноничных ответов. Приходилось прокладывать путь самому, набивая шишки.
Оказалось, что MLOps-инженер должен знать всего понемногу: и понимать в общих чертах machine learning, и уметь написать микросервис, и уметь подружить ML с Docker и Kubernetes, и представлять, как работают видеокарты, и уметь мониторить поведение моделей.
Это доклад о том, что спикер хотел бы рассказать самому себе год назад, будь у него машина времени. Он будет интересен всем, кто разрабатывает и деплоит ML-модели, а также тем, кто только планирует внедрять ML.
Airflow в кровавом энтерпрайзе
Илья Савин
СберМаркет
Илья расскажет, что такое Airflow, и как этот инструмент поможет вам автоматизировать рутинные процессы. Он поделится пошаговой инструкцией, как развернуть Aiflow в своей компании и сделать это красиво.
Заключение
Перечисление докладов получилось длинным, но важно помнить: конференция — это не только доклады.
Будут и расспросы спикеров после докладов в специальных «дискуссионных зонах», и активности компаний-партнёров, и просто офлайновое общение на московской конференционной площадке.
Но если доклады возможно описать заранее, то многое другое в ваших руках: во многом от участников зависит, после какого доклада возникнет оживлённая дискуссия со спикером, не менее интересная, чем сам доклад.
Как девопс — это культура взаимоотношений разработки и эксплуатации, так у конференций есть своя культура взаимоотношений спикеров и участников, где для успеха важны обе стороны. Так что приходите — и добьемся этого вместе.
А нам остаётся напоследок напомнить даты: 5-6 сентября (онлайн), 17-18 сентября (Москва + онлайн). Все подробности и билеты — на сайте конференции.