Как стать автором
Обновить

Бот из машины. Как инженеру сократить время на диагностику дисков

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров6.2K
Всего голосов 54: ↑54 и ↓0+54
Комментарии13

Комментарии 13

Параметры смарта для проверки на гитхаб положить с порогами не хотите) ?

Пока такая идея не рассматривалась, поинтересуюсь у коллег и дам знать. А вам было бы интересно настроить event'ы о достижении порогов для своевременных замен или вы хотели бы как-то иначе использовать?

Ну в целом да, в скриптах для мониторинга.

На самом деле реально трешхолды и скрипт код обработки вывода smartctl было бы интересно увидеть

Очень интересно. А не думали автоматически из ilo брать данные и реализовывать превентивный мониторинг? Или даже продавать это клиентам.

Далеко не на всех МП различных поколений IPMI (IMC, iDRAC, iLO, SIM, ASMB, Intel ME) / BMC дает возможность считывать данные по дискам. А в случаях, где возможность есть, дело ограничивается статусом (для случая iLO чтением через hpasm, хотя я могу ошибаться).

Думаю, для создания такого полноценного продукта, как мониторинг информации через IPMI, нужно еще какое-то время. Это связанно как с обновлением модулей BMC со стороны производителей, так и с полноценным обновлением парка серверов на последние поколения МП.

В компании рассматривается концепция отображения данных IMPI в панели управления. Однако когда можно будет это потрогать, на данный момент неизвестно.

Жаль. Как пользователь ваших продуктов - меня это интересует.

Неужели нельзя прикрутить автоматический модуль к Zabbix или т.п., без ботов?

Смотрите, бот — это инструмент инженеров, придуманный для локальной оптимизации процессов.

Если смотреть с точки зрения компании, то мы больше специализируемся в сторону предоставления инфраструктурной части.

Для создания zabbix модуля нужно продумать много процессов: разработка модулей к клиенту zabbix, включение данных модулей в автоматическую установку различных ОС по умолчанию, принудительное (по умолчанию) подключение к мониторингу в виде серверной части zabbix, отслеживание и уведомление пользователей арендуемого сервера, своевременное обновление, изменение внутренних регламентов по отслеживанию. Все они содержат достаточно много нюансов и касаются по большей части разработки ПО для поддержания инфраструктуры. Надеюсь, компания когда-нибудь придет и к таким продуктам.

К сожалению, сейчас отслеживание состояния комплектующих выделенных серверов — задача пользователя. Для тех, кому не хотелось бы дополнительно организовывать мониторинг и следить за состоянием комплектующих, предлагаются облачные решения. Существуют кейсы, когда все-таки нужно развернуть инфраструктуру на полноценном железе, но их меньше и здесь уже непосредственно можно задуматься о собственном мониторинге.

Можете поделиться, как вы видите реализацию автоматического модуля к Zabbix?

Я давно с ним не работал (равно как и с железом), но почти уверен что есть готовые модули.

Человек дал инженеру фонарик, он не отвечает за освещение в помещении :)

Я не с претензией, просто диагностика дисков выглядит достаточно типичной задачей для систем мониторинга.

Прикольно!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий