Comments 7
Спасибо! Очень занятно!
Про кафку причину я угадал (сервис дискавери через ENV).
Про ZK:
Однажды ночью намертво завис один из гипервизоров, на которых запущены виртуалки ZooKeeper’а.
Ну, е-мае, зачем все яйца в одну корзину складывать? Как вообще с этим боретесь (все члены кластера на одном гипере или все реплики сервиса на одной кубера)?
Ну, и КДПВ как всегда топчик )))
+4
а можно немного деталей про перегрев процессора на баре-метал?
>> поочередный вывод узлов из кластера и координация наших действий с сотрудниками в ДЦ, меняющими кулеры
это какой то блейд был? и
>> поочередный вывод узлов из кластера и координация наших действий с сотрудниками в ДЦ, меняющими кулеры
это какой то блейд был? и
0
к несчастью, нет. это были чудесные сервера одного немецкого дата-центра, который мы не будем называть.
+4
то есть получается у них массово пошли на выход куллеры. мдя, красавцы они)
0
Про кафку есть вариант с отключением дискаверинга через env — enableServiceLinks.
+1
Sign up to leave a comment.
Практические истории из наших SRE-будней. Часть 2