Как стать автором
Обновить

Смертельное переполнение стека. Почему Bunny потеряли свой DNS и как предотвратить подобное

Время на прочтение6 мин
Количество просмотров8.7K
Всего голосов 37: ↑37 и ↓0+37
Комментарии9

Комментарии 9

И SmartEdge, и системы деплоя раздают данные на физические DNS-серверы через Edge Storage и Bunny CDN, а мы только что вывели из строя основную часть глобальной CDN.

Хотя сервер DNS умеет восстанавливаться автоматически, но при этом каждый раз он пытается загрузить сломанный деплой — и просто снова падает. Как вы понимаете, DNS-серверы не могут достучаться до CDN, чтобы загрузить обновление — и круг замыкается.

Хмм, идиотский вопрос - а файл hosts не мог помочь проблему временно?

Тут проблема в том, что упал DNS хостинг провайдера. К которому шлют запросы пользователи сайтов, которые там хостятся. А внести данные в hosts всем-всем-всем пользователям 750 000 сайтов — так себе идея :))

И даже если говорить о реанимации внутренних сервисов — что-то я не особо представляю, как можно быть бы это реализовать в распределенной инфраструктуре, где сервис на площадке А получает одни адреса, а тот же сервис на площадке Б — другие.
тут моментов 2:
— нужно было обновить их DNS-сервера — то есть задача была только для внутренних сервисов.
— как реализовать для распределенной инфр-ры — явно же у них есть какое ср-во централизованного управления.
Средства централизованного управления тоже используют DNS.
явно у них есть список ИП адресов хостов. Простой скрипт к-рый добавит нужные на каждый необходимые 1-2 записи — без проблем.

...а вот если бы у них был свой, бессерверный p2p ботнет...

Это надо кросс-линкнуть с последним падением Facebook.
Базовая причина по сути та же — неразделение ресурсов управления внешней и внутренней инфраструктуры и отсутствие аварийных средств восстановления.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий