«Падение» LKML.org: причина поломки — старый домашний сервер

    По данным отчета The Linux Foundation, с начала Git-эпохи (с 2005 года) в разработке ядра Linux поучаствовали 15 тысяч программистов из 1,5 тыс. компаний. Сегодня разработчики добавляют в систему порядка 7500 строк кода ежедневно, а мажорное обновление ядра выходит каждые 2–3 месяца.

    Однако все изменения нужно как-то контролировать. Для этого существует Linux Kernel Mailing List (LKML) — список рассылки электронной почты, с помощью которого распространяют объявления и обсуждают изменения ядра Linux.

    Поэтому, когда на прошлой неделе в сети появилась информация о том, что один из хостинг-ресурсов LKML — LKML.org — оказался недоступен, в сообществе началось активное обсуждение случившегося. Сегодня мы попробуем разобраться в ситуации.


    / Flickr / Sam Weng / CC

    В чем причина


    В свете последних событий, в сообществе появилось мнение, что выход сайта из строя связан с уязвимостями Meltdown и Spectre. Однако реальной причиной «падения» ресурса стало отключение электроэнергии дома у Джаспера Спаанса (Jasper Spaans) в Нидерландах, где стоял сервер для сайта. В результате сервер перезагрузился (когда «дали свет»), но запросил логин и пароль (по крайней мере такой была первая мысль Джаспера). Ввести идентификационные данные было некому, так как Джаспер находился в отъезде, а подключиться удаленно он не смог, о чем сообщил в своем твиттере.


    Реакция сообщества


    Люди сочли удивительным тот факт, что такой популярный ресурс в 2018 году размещался на одном домашнем компьютере. Событие активно обсуждалось в социальных сетях: кто-то отпускал саркастические комментарии, кто-то пытался связать отказ сервера с багом Meltdown, а кто-то предлагал помощь.

    Например, Джоб Снайдерс (Job Snijders), основатель NLNOG, отметил, что может предоставить Джасперу виртуальную машину для сервиса LKML.org или выслать источник бесперебойного питания, которым пользуется у себя дома.

    Хостинговая компания Liquid Web тоже вызвалась помочь и предложила Джасперу свои услуги. А кто-то даже тегнул Илона Маска и предположил, что тот мог бы помочь с поставкой литий-ионных аккумуляторов Tesla Powerwall.

    Развязка


    Когда Джаспер вернулся домой, он выяснил, что материнская плата не пережила скачка напряжения и сгорела.


    И пока Спаанс ждал доставки платы, он вместе со своим котом начал копировать все данные на VPS, чтобы как можно быстрее запустить сайт. В общей сложности сервис был недоступен около четырех дней. После этой истории Джаспер задумался о его переносе на более надежную инфраструктуру, чем одинокий домашний сервер.

    О чем ещё мы пишем в блоге 1cloud:

    • +17
    • 7,1k
    • 8
    1cloud.ru 199,86
    IaaS, VPS, VDS, Частное и публичное облако, SSL
    Поделиться публикацией
    Комментарии 8
    • +3
      «Пока жареный петух в задницу не клюнет»
      • 0
        Много кто знает как «сделать правильно», но не так много делают правильно.
        • 0
          Я в далёком 2012 решил заняться хостингом игровых серверов. Начинал с обычного сервера дома. На нём проводились многие официальные Российские турниры по L4D/L4D2. Потом уже поставил полноценные железки на разных хостингах. А на домашнем, для экономии, долго ещё крутил панель управления и сайт. Так что мне подобная история знакома. Может ему просто некогда было заниматься. Может лень или страшно браться. Хотя, конечно, для подобных сервисов надо думать на сто шагов вперёд и продумывать многократное резервирование.
          • +1
            Если быть объективным, то ещё стоит сравнить с большими площадками, не лучше ли у него показатель отказов по факту получился. А то и амазон бывает падает. Я при этом не призываю хостить дома.
            • 0
              Как вообще сочетается
              сервер перезагрузился (когда «дали свет»), но запросил логин и пароль
              и
              материнская плата не пережила скачка напряжения и сгорела
              ?
              • +3
                Как я понял, Джаспер сперва решил, что проблема в необходимости ввести пароль. Но когда он вернулся домой то выяснил, что сгорела плата и проблема посерьезнее
              • +1

                Сервер работает 15 лет. Это 5475 дней. Не работал 4 дня. Это показатель надёжности 0.999.


                конечно это не призыв. У меня за неделю капитального ремонта электропроводки сгорели два UPS'а...

                • 0
                  Но про 5475 дней никто не помнит, а про неработавшие 4 дня запомнили все.

                  Это ненормально, но это печальный факт. Когда что-то получается хорошо — мы этого не замечаем. Мы замечаем что-то тогда, когда оно не работает или работает плохо.

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое