Pull to refresh

Comments 4

В разделе о резервном копировании кластеры вы упоминаете Velero. А вы пробовали его в деле? На сохранение ≈180К объектов (не самый большой кластер), уходит несколько минут, а вот восстановление из такой копии занимает около 5 часов. Проверено на практике. Имхо, для резервного копирования/восстановления лучше пользоваться снапшотами etcd.

У меня нет опыта восстановления, но раз у вас есть - возможно подскажете чем плох метод as code? У меня к примеру раскатывается кластер(10-15 мин) + репозиторий с ресурсами, естественно данные отдельными инструментами хранятся.

Метод as code не плох, но в определенных сценариях недостаточен: например, если вы предоставляете куб пользователям, как некую преднастроенную платформу с кастомными admission хуками, psp, квотами и т.п., то развернуть кластер с нужными компонентами, действительно, проще и надёжнее используя подход as code. Но если при этом у вас сотни, а то и больше пользователей, каждый со своими приложениями, может возникнуть ситуация, что им нужно самим заново деплоить их нагрузку. В этом случае восстановление из бэкапа может быть предпочтительнее. В этом вопросе многое зависит от того, как построена система.

Снапшот кластера это хорошо и быстро, но велеро умеет бэкапить/ресторить гранулярно. Исключать ненужное, логически разделять бэкапы(неймспейсы, типы ресурсов и т. д.) и ресторить только нужное. Хотелось бы попробовать параллельный рестор, но пока не встречалось таких размеров, если вы пробовали, то буду благодарен, если поделитесь результатами

Sign up to leave a comment.