Обновить

Комментарии 4

В разделе о резервном копировании кластеры вы упоминаете Velero. А вы пробовали его в деле? На сохранение ≈180К объектов (не самый большой кластер), уходит несколько минут, а вот восстановление из такой копии занимает около 5 часов. Проверено на практике. Имхо, для резервного копирования/восстановления лучше пользоваться снапшотами etcd.

У меня нет опыта восстановления, но раз у вас есть - возможно подскажете чем плох метод as code? У меня к примеру раскатывается кластер(10-15 мин) + репозиторий с ресурсами, естественно данные отдельными инструментами хранятся.

Метод as code не плох, но в определенных сценариях недостаточен: например, если вы предоставляете куб пользователям, как некую преднастроенную платформу с кастомными admission хуками, psp, квотами и т.п., то развернуть кластер с нужными компонентами, действительно, проще и надёжнее используя подход as code. Но если при этом у вас сотни, а то и больше пользователей, каждый со своими приложениями, может возникнуть ситуация, что им нужно самим заново деплоить их нагрузку. В этом случае восстановление из бэкапа может быть предпочтительнее. В этом вопросе многое зависит от того, как построена система.

Снапшот кластера это хорошо и быстро, но велеро умеет бэкапить/ресторить гранулярно. Исключать ненужное, логически разделять бэкапы(неймспейсы, типы ресурсов и т. д.) и ресторить только нужное. Хотелось бы попробовать параллельный рестор, но пока не встречалось таких размеров, если вы пробовали, то буду благодарен, если поделитесь результатами

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
to.slurm.io
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия
Представитель
Антон Скобин