Как стать автором
Поиск
Написать публикацию
Обновить

WMF: Глобальный перебой (неполадки с охлаждением и DNS)

Время на прочтение1 мин
Количество просмотров740
Автор оригинала: mark - Wikimedia Technical Blog
imageГоворят, во Флориде ещё осталось немного Википедии.... ©

Из-за проблемы с перегревом в нашем европейском дата-центре (в Амстердаме) многие из наших серверов отключились для самозащиты. Поскольку это повлияло на доступ европейских пользователей ко всем Википедиям и другим проектам, мы были вынуждены переместить весь пользовательский трафик на наш кластер во Флориде (в Санкт-Петербурге), для которого у нас есть введённая в действие стандартная быстрая процедура восстановления после отказа (failover), которая меняет наши DNS-записи.

Однако, вскоре после того как мы сделали это failover-переключение, то оказалось, что этот отказоустойчивый механизм сейчас неисправен, что привело к прекращению работы резолюции DNS (DNS resolution) сайтов Викимедиа в глобальном масштабе. Эта проблема была быстро решена, но, к сожалению, восстановление доступа для всех может занять до часа из-за эффектов кэширования.

Мы приносим извинения за причиненное неудобство.

Обновление: К сожалению, для многих этот перебой, кажется, длился дольше, чем час. Похоже, что многие провайдерские резолверы DNS не учитывают так называемые Negative Cache TTL, которые мы послали, и вместо этого используют бОльшие значения. Мы обошли эту проблему путем переименования неисправной записи DNS во что-нибудь другое.

Обновление от 21:32 по Универсальному координированному времени: Наш SSL-доступ secure.wikimedia.org был отключен из-за перегрузки, но сейчас работает.

Wikimedia Technical Blog, techblog.wikimedia.org

Копии Википедии: английской (легальная), русской («пиратская» =)). Может быть вам также поможет Coral Content Distribution Network.

Кстати, у Википедии в 2005 году после отключения электричества был гораздо более масштабный сбой.
Теги:
Хабы:
Всего голосов 42: ↑31 и ↓11+20
Комментарии15

Публикации

Ближайшие события