Как стать автором
Обновить
55
Карма
0
Рейтинг

Пользователь

Оценка производительности CNI для Kubernetes по 10G сети (август 2020)

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *Kubernetes *
Перевод


TL;DR: Все CNI работают как надо, за исключением Kube-Router и Kube-OVN, Calico за исключением автоматического определения MTU — лучше всех.

Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Просмотры 5.4K
Комментарии 2

Kubernetes 1.17 — как обновиться и не потратить весь error budget

Блог компании Southbridge DevOps *Kubernetes *
image

9 декабря вышла очередная версия Kubernetes — 1.17. Ее девиз — «Стабильность», множество фич получили статус GA, некоторое количество устаревших фич было удалено…

И, как всегда, наш любимый раздел Action Required файла CHANGELOG-1.17.md требует к себе внимания.

Поработаем руками…
Читать дальше →
Всего голосов 18: ↑16 и ↓2 +14
Просмотры 3.3K
Комментарии 3

Слёрм: на онлайн-курсы скидка 50% в честь Черной пятницы

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *Kubernetes *


Лично я не люблю скидки. Большие скидки означают, что цена изначально была мощно заряжена.
Если есть резерв, лучше уменьшить цену. Первый Слёрм Мега стоил 75 тысяч, вторая Мега — 60, а третья стоит 50.


С другой стороны, мне нравится традиция Черной пятницы, пусть она и опошлена в России конским подъемом цен накануне.


Мы не можем скинуть цену на интенсивы (некуда), но можем нарушить принцип «единая цена на все формы обучения: зал, удаленка, онлайн».


29 ноября, ровно на сутки, Слёрм делает скидку 50% на все онлайн-курсы. Слёрм Kubernetes (Джуниор + База + Мега) можно купить за 32 500 рублей, а новый Слёрм Пром (Prometheus) за 7500 рублей. Не забывайте указывать промокод BF19.


Если прямо сейчас денег нет, или бюджет надо обсуждать с руководством, оставьте заявку, пока есть скидка, а по срокам оплаты договоримся.

Всего голосов 28: ↑21 и ↓7 +14
Просмотры 4K
Комментарии 15

Заделываем дыры в кластере Kubernetes. Доклад и расшифровка с DevOpsConf

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *Kubernetes *

Павел Селиванов, архитектор решений Southbridge и преподаватель Слёрма, выступил с докладом на DevOpsConf 2019. Этот доклад — часть одной из тем углубленного курса по Kubernetes «Слёрм Мега».


Слёрм Базовый: введение в Kubernetes проходит в Москве 18-20 ноября.
Слёрм Мега: заглядываем под капот Kubernetes — Москва, 22-24 ноября.
Слёрм Онлайн: оба курса по Kubernetes доступен всегда.



Под катом — расшифровка доклада.

Всего голосов 29: ↑28 и ↓1 +27
Просмотры 9.5K
Комментарии 14

Моя вторая неделя с Haiku: множество скрытых алмазов и приятных сюрпризов, а также некоторые проблемы

Блог компании Southbridge Open source *Системное администрирование *Софт
Перевод


Редактирование снимка экрана для этой статьи — в Haiku


TL;DR: Производительность намного лучше, чем изначально. Виноват был ACPI. Запуск в виртуальной машине работает прекрасно для показа экрана. Git и менеджер пакетов встроены в файловый менеджер. Публичные беспроводные сети не работают. Разочарование с python.

Читать дальше →
Всего голосов 27: ↑24 и ↓3 +21
Просмотры 8.3K
Комментарии 2

Путешествие по ЦОД Selectel. Динозавр в огне, VMware, С2F5H и невидимый оборотень

Блог компании Southbridge Системное администрирование *IT-инфраструктура *Виртуализация *Хранилища данных *

Работа сисадмина основана на вере, что инженеры ЦОДа знают свое дело. Мы создаем отказоустойчивые кластеры, но чего будет стоить эта отказоустойчивость, если отключится электричество? Какая разница, как быстро сервер обрабатывает запрос, если упал канал от ЦОДа до точки обмена трафиком? Как поднимать сервер, если он физически перегрелся?


А хотелось бы не верить, а знать, как именно создается отказоустойчивость на железном уровне. Откуда берутся те «девятки» надежности оборудования, о которых мы говорим, формулируя SLA Кубернетесов. Что происходит, когда проект горит в самом прямом смысле этого слова.


Нам повезло пройтись по ЦОД Selectel на третий день Слёрма DevOps, заглянуть в святая святых и даже кое-что сфотографировать на память. А также мы спросили о легендах компании, которые сотрудники Selectel никому никогда не рассказывают. Да и как выяснилось, сами уже не помнят.


Нашу компанию Southbridge связывают с Selectel давние партнёрские отношения. Сейчас мы поддерживаем 58 проектов, размещенных на серверах провайдера. Когда клиенту нужен сервер, расположенный в России, мы рекомендуем Selectel, потому что по опыту работы считаем его самым надежным и удобным провайдером IT-инфраструктуры.


Поехали!



Читать дальше →
Всего голосов 38: ↑36 и ↓2 +34
Просмотры 11K
Комментарии 12

Kubernetes 1.16 — как обновиться и ничего не сломать

Блог компании Southbridge DevOps *Kubernetes *


Сегодня, 18 сентября, выходит очередная версия Kubernetes — 1.16. Как всегда нас ждет много улучшений и новинок. Но я хотел бы обратить ваше внимание на разделы Action Required файла CHANGELOG-1.16.md. В этих разделах публикуются изменения, которые могут сломать работу вашего приложения, инструментов по обслуживанию кластера или требуют внесения изменений в файлы конфигурации.

В общем, требуют ручного вмешательства…
Читать дальше →
Всего голосов 38: ↑34 и ↓4 +30
Просмотры 5.8K
Комментарии 4

Разбор: ООМ на узле Kubernetes

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *
Перевод


Проблемы в производственной среде — это всегда беда. Происходят именно тогда, когда уходишь домой, а причина всегда кажется глупой. Недавно у нас на узлах в кластере Kubernetes закончилась память, правда узел тут же восстановился, без видимых прерываний. Сегодня мы расскажем об этом случае, о том, какой урон мы понесли и как намерены избегать подобной проблемы в будущем.


Случай первый


Суббота, 15 июня 2019 г., 17:12

Читать дальше →
Всего голосов 28: ↑26 и ↓2 +24
Просмотры 8.1K
Комментарии 17

Лучшие практики для контейнеров Kubernetes: проверки работоспособности

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *
Перевод


TL;DR


  • Чтобы добиться высокой наблюдаемости контейнеров и микросервисов, журналов и первичных метрик мало.
  • Для более быстрого восстановления и повышения отказоустойчивости приложения должны применять Принцип высокой наблюдаемости (HOP, High Observability Principle).
  • На уровне приложение для НОР требуется: должное журналирование, тщательный мониторинг, проверки работоспособности и трассировки производительности/переходов.
  • В качестве элемента НОР используйте проверки readinessProbe и livenessProbe Kubernetes.
Читать дальше →
Всего голосов 26: ↑24 и ↓2 +22
Просмотры 7.5K
Комментарии 8

Апгрейд для ленивых: как PostgreSQL 12 повышает производительность

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *
Перевод

PostgreSQL 12, последняя версия «лучшей в мире реляционной базы данных с открытым исходным кодом», выходит через пару-тройку недель (если все пойдет по плану). Это соответствует обычному расписанию — новая версия с уймой новых возможностей выходит раз в год, и, честно говоря, это впечатляет. Поэтому я и стал активным членом сообщества PostgreSQL.


По-моему, в отличие от прошлых выпусков, PostgreSQL 12 не содержит одной-двух революционных функций (как, например, секционирование или параллелизм запросов). Я как-то пошутил, что главная фишка PostgreSQL 12 — в большей стабильности. А разве не это нужно, когда вы управляете критически важными данными вашего бизнеса?


Но PostgreSQL 12 этим не ограничивается: с новыми возможностями и усовершенствованиями приложения будут работать лучше, а от вас всего-навсего требуется сделать апгрейд!


(Ну, может, еще индексы перестроить, но в этом релизе это не так страшно, как мы привыкли.)

Читать дальше →
Всего голосов 46: ↑45 и ↓1 +44
Просмотры 30K
Комментарии 13

Что делать, если протухли сертификаты и кластер превратился в тыкву?

Блог компании Southbridge Kubernetes *
Если в ответ на команду kubectl get pod вы получаете:

Unable to connect to the server: x509: certificate has expired or is not yet valid

то, скорее всего, прошел год, у сертификатов вашего kubernetes закончился срок действия, компоненты кластера перестали их использовать, взаимодействие между ними прекратилось и ваш кластер превратился в тыкву.

image
Читать дальше →
Всего голосов 27: ↑23 и ↓4 +19
Просмотры 28K
Комментарии 12

Развертывание приложений на нескольких кластерах Kubernetes с Helm

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *
Перевод


Как Dailymotion использует Kubernetes: развертывание приложений


Мы в Dailymotion начали использовать Kubernetes в продакшене 3 года назад. Но развертывать приложения на нескольких кластерах то еще удовольствие, поэтому в последние несколько лет мы старались улучшить наши инструменты и рабочие процессы.

Читать дальше →
Всего голосов 23: ↑22 и ↓1 +21
Просмотры 6.2K
Комментарии 1

Слёрм: гусеница превратилась в бабочку

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *Kubernetes *


<TL;DR>


  1. Слёрм действительно позволяет войти в тему Kubernetes или подтянуть свои знания.
  2. Участники довольны. Тех, кто ничего нового не узнал или не решил свои задачи, считанные единицы. Безусловным манибеком первого дня («Если вы чувствуете, что Слёрм вам не подходит, мы вернем полную цену билета») воспользовался всего один человек, обосновав тем, что переоценил свои силы.
  3. Следующий Слёрм пройдет в начале сентября в Питере. Selectel, наш бессменный спонсор, предоставляет не только облако для стендов, но и свой конференц-зал.
  4. Мы повторяем базовый Слёрм (9-11 сентября) и представляем новую программу: Слёрм DevOps (4-6 сентября).
Читать дальше →
Всего голосов 24: ↑20 и ↓4 +16
Просмотры 4.2K
Комментарии 0

Резервное копирование, часть 4: Обзор и тестирование zbackup, restic, borgbackup

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *


В данной статье будут рассматриваться программные средства для резервного копирования, которые путем разбиения потока данных на отдельные компоненты (chunks), формируют репозиторий.


Компоненты репозитория могут дополнительно сжиматься и шифроваться, а самое главное — при повторных процессах резервного копирования — переиспользоваться повторно.


Резервная копия в подобном репозитории — именованная цепочка связанных друг с другом компонентов, например, на основе различных hash-функций.


Есть несколько подобных решений, я остановлюсь на 3: zbackup, borgbackup и restic.

Читать дальше →
Всего голосов 26: ↑26 и ↓0 +26
Просмотры 16K
Комментарии 20

Docker: вредные советы

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *


Когда я учился водить машину, на первом же занятии инструктор выехал на перекресток задним ходом, а потом сказал, что делать так нельзя — вообще никогда. Это правило я запомнил сразу и на всю жизнь.


Читаешь детям «Вредные советы» Григория Остера, и видишь, как легко и непринужденно до них доходит, что так делать нельзя.


О том, как правильно писать Dockerfile, написана куча статей. Но мне не попадалось инструкций, как писать неправильные Dockerfile. Восполняю этот пробел. И, может быть, в проектах, которые я получаю на поддержку, таких докерфайлов станет меньше.

Читать дальше →
Всего голосов 70: ↑51 и ↓19 +32
Просмотры 36K
Комментарии 66

Grafana как еще один инструмент для технического мониторинга создаваемых нами программных продуктов

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *
Перевод

Очередная статья в серии «Инструменты мониторинга Logicify» рассказывает о Grafana. Это программное средство мы используем для визуализации и анализа данных как внутренних, так и внешних проектов. Статья может быть полезна техническим директорам, разработчикам, DevOps, системным администраторам, менеджерам проектов, а также всем заинтересованным лицам.


image

Читать дальше →
Всего голосов 24: ↑21 и ↓3 +18
Просмотры 177K
Комментарии 7

Про дешевые датацентры, РКН и защиту от DDoS

Блог компании Southbridge Системное администрирование *Серверное администрирование *

Иногда проект живет в недорогом зарубежном датацентре, попадает под ковровые блокировки Роскомнадзора, периодически оказывается под DDoS атаками, но при этом имеет терабайты данных и трафика.


Как с этим жить?



Преамбула


У нас на поддержке есть небольшой фотобанк. Не будем называть имя и страну, только некоторые технические данные:
50 Тб данных для хранения, ежемесячно обновляется порядка 100 Гб, «горячие данные» (к ним идет 95% запросов) — 200 Гб.
Средний трафик — 50 Тб/мес.


Для размещения фотографий несколько лет назад выбрали несколько серверов SX серии от Hetzner с большими дисками (для хранения ПД пришлось придумывать более сложное решение, но об этом в другой раз).


В Southbridge сомневались, что Hetzner подходит для такого проекта, но требуемый уровень доступности и качества связности достигался.


Плюс для такого проекта использование CDN окажется на порядок дороже, чем раздача статики с серверов в недорогом датацентре.

Читать дальше →
Всего голосов 38: ↑34 и ↓4 +30
Просмотры 15K
Комментарии 25

29-31 октября: создаем production-ready кластер Kubernetes

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *


Southbridge проводит живой и онлайн-интенсив по Кубернетес.


Материал рассчитан на тех, кто знает Linux, Docker, Kubernetes, Ansible, Helm и Git.


Интенсив — в первую очередь практика. Каждый участник создаст свой кластер в облаке Selectel.
Теоретическая часть — это не пересказ мануалов, а опыт и рекомендации спикеров.


Темы занятий:

Всего голосов 17: ↑13 и ↓4 +9
Просмотры 4.1K
Комментарии 0

Приезжайте изучать классическое администрирование: регламенты, инструменты, скрипты Southbridge

Блог компании Southbridge Системное администрирование *Серверное администрирование *DevOps *

За 10 лет Southbridge создал стандарт работы, который позволяет одному администратору поддерживать 150 серверов, быстро проводить первичную настройку, легко передавать проект между администраторами и группами, сразу видеть, что сделали ночные дежурные, быстро входить в курс дела после отпуска, и, естественно, обеспечить клиенту надежность и безопасность инфраструктуры.


C 22 по 24 октября Southbridge проводит интенсив для системных администраторов, где покажет свои подходы, регламенты, инструменты, инструкции и скрипты.



По сути РедСлёрм — это набор материалов для подготовки нового сотрудника Southbridge.


Осваивать подход к администрированию, основанный на унификации и стандартизации, полезно даже начинающему администратору.


Все, что можно, отрабатываем на практике.

Читать дальше →
Всего голосов 17: ↑15 и ↓2 +13
Просмотры 6K
Комментарии 11

Информация

В рейтинге
Не участвует
Откуда
Воронеж, Воронежская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность