Комментарии 91
Вот теперь и думай, что выбирать в качестве самого надёжного хостинга для критичных приложений.
Нет абсолютно надежных. Все могут поломаться, даже самые надежные. Причем это происходит в самый ответственный момент. По этому нужно автоматически запускать сервер в другом датаценре EC2, если не доступен в вашем.
P.S.
У нас сервер на EC2 в US East — работает. У них же там (в US East) 4-ре датацентра — на то оно и облако.
P.S.
У нас сервер на EC2 в US East — работает. У них же там (в US East) 4-ре датацентра — на то оно и облако.
А что делать с базой? Регулярная репликация между датацентрами дорого выйдет?
Высокая доступность стоит дорого. Для среднего сервиса высокая доступность не нужна — 1 день простоя не страшно.
Насчет 1 дня я бы не был так уверен. Вопрос в том что теряется.
К примеру если речь об сайте которому пользователи доверили свои деньги, то падение на день подрывает доверие и к тому же может иметь финансовые последствия.
Есть знакомый у которого интернет-магазин с оплатой через Paypal. Так вот как только магазин падает на сколько-нибудь серьёзное время сразу идут запросы на отмену платежей (диспуты и чарджбеки) и за день можно порерять сколько сколько за месяц заработать.
К примеру если речь об сайте которому пользователи доверили свои деньги, то падение на день подрывает доверие и к тому же может иметь финансовые последствия.
Есть знакомый у которого интернет-магазин с оплатой через Paypal. Так вот как только магазин падает на сколько-нибудь серьёзное время сразу идут запросы на отмену платежей (диспуты и чарджбеки) и за день можно порерять сколько сколько за месяц заработать.
даже для крупного сервиса это не так страшно. События последних дней тому пример ;)
А еще есть надежность каналов связи. От банды пьяных экскаваторщиков защититься очень сложно.
Вот мы и узнаем, что жизнь без этих сервисов и стартапов вполне реальна.
Завтра в новостях: «Производительность труда внезапно выросла на 83%».
а мне вот Спрингпад (тоже под раздачу попал) совсем не мешал работать. Так что ехидничество считаю неуместным — не только игры пострадали
как быть тем, для кого эти игры это и есть работа? ;)
Не поверите, но теоретически жизнь реальна и без Интернета вообще.
На самом деле уже нет.
И дело тут не столько в фейсбуке сколько в том, что существенная часть механизмов экономики и военной безопасности держится именно на интернете.
И дело тут не столько в фейсбуке сколько в том, что существенная часть механизмов экономики и военной безопасности держится именно на интернете.
теоретически и за МКАДом жизнь есть
In theory theory and practice are the same. In practice they are not.
Теоретически, теория и практика должні совпадать. На практике же, они не совпадают.
:)
Теоретически, теория и практика должні совпадать. На практике же, они не совпадают.
:)
...at this time.
Скайнет вообще должен был ударить сначала в августе 1997, но второй Т-800 с Джоном оттянули конец на 2004-ый.
Все прибаутки последних дней по поводу Скайнета — липа.
Все прибаутки последних дней по поводу Скайнета — липа.
>From the information I have and to answer your questions, SkyNet did not have anything to do with the service event at this time.
Не, ну ясное дело — автора ответа уже в заложниках держат.
Не, ну ясное дело — автора ответа уже в заложниках держат.
Конечно нет, это Джон Коннор нанес превентивный удар. Дата опять отложена.
Среди сервисов, которые испытали и продолжают испытывать проблемы — Heroku, Quora, About.me, Foursquare, FormSpring, Lighthouse, Nvidia's Developer Portal, reddit, SpringPad.
Полный список пострадавших сервисов:
http://www.ec2disabled.com/
Полный список пострадавших сервисов:
http://www.ec2disabled.com/
Кстати Foursquare возобновил работу примерно через час.
Остальные сервисы повесили fail-whale страницы.
Сразу стало понятно, кто делает бекапы, а кто уже делает бекапы.
Остальные сервисы повесили fail-whale страницы.
Сразу стало понятно, кто делает бекапы, а кто уже делает бекапы.
Тут чуть сложнее.
Надо было делать бекап в другую Availability Zone.
Потому как бекапы у меня например были. Но забрать я их так и не смог из-за постоянных ошибок :)
Надо было делать бекап в другую Availability Zone.
Потому как бекапы у меня например были. Но забрать я их так и не смог из-за постоянных ошибок :)
Много интересного здесь:
search.twitter.com/search?had_popular=true&q=ec2&result_type=recent
search.twitter.com/search?had_popular=true&q=ec2&result_type=recent
а я как раз зарегался пощупать амазон, думаю чего это у меня инстансы не запускаются…
амазон забыл продлить домен?
Обидно за assembla.com, тоже пострадала. Только начал привыкать
По поводу Скайнета: есть версия, что запуск Скайнета не состоялся, так как они тоже хостились на Амазоне…
Когда падают облака всех накривает туманом :)
Вот хорошая статья, где объясняется, что и как упало для простых смертных:
justinsb.posterous.com/aws-down-why-the-sky-is-falling
justinsb.posterous.com/aws-down-why-the-sky-is-falling
И поэтому репозитории на Assembla.com тоже частично отвалились. Вот и накрылись все стартапы :)
Кстати умные рекламщики быстро сообразили и начали выкладывать в Твиттер по тегу #ec2 рекламу VPS и конкурирующих cloud-решений — RackSpace, elastichosts.
я там прочитал про elastichosts.
Еще интереснейший твит был от @starbucks:
twitter.com/#!/Starbucks/status/61139468912041984
Еще интереснейший твит был от @starbucks:
twitter.com/#!/Starbucks/status/61139468912041984
В этих ваших твиттерах пишут, что Амазон уже поднялся. Все сервера моей компании поднялись.
Статусная страница самого Амазона пока молчит.
Статусная страница самого Амазона пока молчит.
В такие моменты я могу им только сочувствовать. Никто и никогда не может дать 100% гарантии 100% работоспособности. Потому что любое резервирование имеет запас прочности и существует вероятность, что случится именно так, что не поможет.
Кроме того, есть человеческий фактор — вынутый невовремя или не тот кабель, ошибка в команде, ошибка в коде и т.д.
Кроме того, есть человеческий фактор — вынутый невовремя или не тот кабель, ошибка в команде, ошибка в коде и т.д.
В цикле или по хрону запрашивать сервис на доступность, и если таймаут превысил нужный включать сирену через что-то вроде habrahabr.ru/blogs/DIY/112511/
Я настроил для этого консольную sip звонилку linphone которая при необходимости инициирует звонок на мой alarm phone в котором стоит громкая сирена в качестве звонка. Если интересно могу по пунктам рассказать, как чего настраивать.
Рассказываю.
Делал это я для мониторинга LA на своем серваке. Звонилка тоже на этом же серваке живет, но ничего не мешает поставить звонилку на любой VDS чтобы она мониторила другие серваки.
Для начала настраиваем саму звонилку, вот подробный мануал: www.linux16.net/node/538
Только в качестве сип шлюза я выбрал voipdiscount так как у меня там был аккаунт. Кстати алярм звонки мне обходятся совершенно бесплатно. Время разговора 0 сек.
Настроив все по мануалу который я указал выше, я подправил под себя скриптик alarm.call
И второй скриптик для мониторинга LA и инициирования звонка, который запускается по крону раз в пару минут:
Уже пару раз просыпался под веселые звуки сирены когда мой сервак умирал при странных обстоятельствах.
Делал это я для мониторинга LA на своем серваке. Звонилка тоже на этом же серваке живет, но ничего не мешает поставить звонилку на любой VDS чтобы она мониторила другие серваки.
Для начала настраиваем саму звонилку, вот подробный мануал: www.linux16.net/node/538
Только в качестве сип шлюза я выбрал voipdiscount так как у меня там был аккаунт. Кстати алярм звонки мне обходятся совершенно бесплатно. Время разговора 0 сек.
Настроив все по мануалу который я указал выше, я подправил под себя скриптик alarm.call
#!/usr/bin/expect -f
set timeout 60
spawn linphonec
expect "Registration on sip:voipdiscount.com successful."
send "call +your_phone_number\n"
expect "Connected."
set timeout 3
send "terminate\n"
expect "User is busy."
send "terminate\n"
send "quit\n"
И второй скриптик для мониторинга LA и инициирования звонка, который запускается по крону раз в пару минут:
<?php
$maxLA = 40;
if (getLA() >= $maxLA)
exec("./alarm.call");
function getLA()
{
$la = `cat /proc/loadavg`;
$la = explode(" ",$la);
return $la[0];
}
?>
Уже пару раз просыпался под веселые звуки сирены когда мой сервак умирал при странных обстоятельствах.
просто и надежно, возьму на заметку!
Сирена не сирена, а sms можно получить :) попробуйте monitorius.com или любой другой uptime monitoring сервис ;)
Еще есть pingdom.com из простых и более-менее бюджетных (поминутная проверка, $10 в месяц + $0,45 за sms), год пользуюсь — доволен.
Как хорошо что у меня свой сервер.
Пострадавшим — сочувствую
Пострадавшим — сочувствую
Это, как бы, тоже не проблема для «бабушек с лопатами» или «банды экскаваторщиков».
Это Вы к чему вообще?
Вот
Ну, когда семля налетит на небесную ось — вообще все ляжет и все лягут.
Сколько чего не резервируй, а вероятность падения все равно остается. Не пойму почему минусят, разве иметь свой маленький ДЦ уже не комильфо? Я вот так не считаю. Живу себе свокойно, и если недай-бог чего падает — сам себе нехороший человек.
Но по сравнению с резервной площадкой у хостера — аптайм моих сервисов в собственном ДЦ куда дольше. За последние 3 года моя собственная площадка была не доступна два раза. У хостера — 5 раз.
Я не претендую на истинность. Лично мне так проще и дешевле. Аппетиты у меня скромные и своего облака из 8 лезвий мне пока хватает за глаза.
Сколько чего не резервируй, а вероятность падения все равно остается. Не пойму почему минусят, разве иметь свой маленький ДЦ уже не комильфо? Я вот так не считаю. Живу себе свокойно, и если недай-бог чего падает — сам себе нехороший человек.
Но по сравнению с резервной площадкой у хостера — аптайм моих сервисов в собственном ДЦ куда дольше. За последние 3 года моя собственная площадка была не доступна два раза. У хостера — 5 раз.
Я не претендую на истинность. Лично мне так проще и дешевле. Аппетиты у меня скромные и своего облака из 8 лезвий мне пока хватает за глаза.
На старой работе весь моск съели в своё время, что надо на амазон переезжать, чтобы клиентам всё было доступно 24/7. Там, мол, все круто и мы лэйбл добавим, что у нас всё на амазоне, клиентов привлечем этим.
А с месяц тому они всё таки переехали на амазон. Надо узнать задело их или нет, что ли.
А с месяц тому они всё таки переехали на амазон. Надо узнать задело их или нет, что ли.
Учебная тревога от амазона прошла успешно. Кто не зареплицировался я не виноват.
Мне понравился ответ от компании Quora — «We’d point fingers, but we wouldn’t be where we are today without EC2»
Хорошо, что Европы не коснулось
мы быстро починили, смонтировав ami образы с последнего backup EBS
хотя это все зависит от вашей архитектуры
пилим нормальный деплой через SVN и байбай EBS
хотя это все зависит от вашей архитектуры
пилим нормальный деплой через SVN и байбай EBS
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Дата-центр Amazon EC2 упал, отправив в даун сотни сайтов и сервисов