Pull to refresh

Comments 11

простите, может я очень долго спал.. но с каких пор винда научилась в lvm и xfs?

Благодарю за наблюдательность. Это опечатка, приношу свои извинения!

Мне кажется такое актуально было лет 10 назад. Сейчас можно документировать сервера через ansible, puppet, terraform и строя мониторинг вокруг этого. Документация нужно только о том какому проекту принадлежит сервис. Если у вас даже сервер стоит под столом админа, то тоже имеет смысл настроить его через ansible и положить манифесты в git

Поддерживаю. Подобного рода документация имеет свойство хаотично устаревать и нет возможности проверить ее актуальность, кроме как ручками. Если документирование построено на базе ансибла, который используется для деплоя и конфигурирования приложений, то актуальность документации всегда соответствует дате последнего запуска плейбука. Тоже самое касается и мониторинга. Ресурсы учитывать стоит из системы мониторинга.
Впрочем, было заявлено что это набор шаблонов для стартапа, в котором скорее всего как всегда нет человека, который бы занимался сопровождением ансибла и мониторинга, так что наверное в какой-то степени это может быть полезно до поры до времени.

Всё так ― здесь мы хотели дать принципиальные рекомендации без привязки к одному инструменту и рассматривали ситуации, когда сервер арендуют для проверки гипотез и даже возможно воспринимают его как "временный".
А про Terraform напишем отдельно :)

UFO just landed and posted this here

Правильно. Я даю чек-лист, Вы обладаете полезным инструментом. Что нельзя осуществить инструментом, можно собрать скриптами, написанными для сбора конкретных данных. Что нельзя собрать скриптами, можно собрать вручную. Получается сформированная документация от специалистов для специалистов.

Чеклист приличный. Теперь еще написать инструкции по восстановлению работы на случай пожара в ДЦ, прилета инопланетян, заражения админского компьютера вирусом и т.д. и т.п.

А то получите нерабочий сервер, вышеописанный талмуд и блымающего глазами "нового человека". Другое дело - четкий доклад о ходе устранения инцидента...

Наличие документации это намного лучше чем ее отсутствие, а примерный план по документированию. это хорошая штука. А то берёшься за мелкую компанию до 100 компов и ничего нет от слова совсем, где поменялось 500 админов. Эти ребята не слышали про слово ansible, да и zabbix у них максимум мониторит принтеры. Поэтому считаю инфу изложенную в статье полезной для таких контор. А ansible хорошая штука, но таким ребятам zabbix бы нормально настроить)

То, про что Вы говорите — называется BC/DR план. У нас есть услуга по организации такого плана. Если Вы обратитесь к своему сервис-менеджеру для получения этой услуги, имея документацию, близкую к описанной, то на проработку плана потребуется меньше времени, так как специалисты, составляющие план, будут достаточно осведомлены о Вашей инфраструктуре.

Всё это делать вручную, не останется времени на работу.

Ansible + мониторинг. Мониторинг показывает всё важное, например состояние дисков, памяти и важные сервисы.

Sign up to leave a comment.