Как стать автором
Обновить

Комментарии 91

Вот теперь и думай, что выбирать в качестве самого надёжного хостинга для критичных приложений.
Нет абсолютно надежных. Все могут поломаться, даже самые надежные. Причем это происходит в самый ответственный момент. По этому нужно автоматически запускать сервер в другом датаценре EC2, если не доступен в вашем.

P.S.
У нас сервер на EC2 в US East — работает. У них же там (в US East) 4-ре датацентра — на то оно и облако.
А что делать с базой? Регулярная репликация между датацентрами дорого выйдет?
Высокая доступность стоит дорого. Для среднего сервиса высокая доступность не нужна — 1 день простоя не страшно.
Насчет 1 дня я бы не был так уверен. Вопрос в том что теряется.
К примеру если речь об сайте которому пользователи доверили свои деньги, то падение на день подрывает доверие и к тому же может иметь финансовые последствия.

Есть знакомый у которого интернет-магазин с оплатой через Paypal. Так вот как только магазин падает на сколько-нибудь серьёзное время сразу идут запросы на отмену платежей (диспуты и чарджбеки) и за день можно порерять сколько сколько за месяц заработать.
даже для крупного сервиса это не так страшно. События последних дней тому пример ;)
А еще есть надежность каналов связи. От банды пьяных экскаваторщиков защититься очень сложно.
Да что там банда экскаваторщиков. Дайте бабке лопату и скажите, что там лежит медь. Тактическая распределенная группировка бабушек вообще весь интернет положит.
тактическая группа — это одна бабушка с лопатой.

а несколько — это уже стратегическая с разделяющейся головной частью.
Вот мы и узнаем, что жизнь без этих сервисов и стартапов вполне реальна.
НЛО прилетело и опубликовало эту надпись здесь
Завтра в новостях: «Производительность труда внезапно выросла на 83%».
Скорее так:
Завтра в новостях: «У 83% рабочего персонала пропал урожай на ферме! Как это отразится на мире во всём мире?!».
а мне вот Спрингпад (тоже под раздачу попал) совсем не мешал работать. Так что ехидничество считаю неуместным — не только игры пострадали
как быть тем, для кого эти игры это и есть работа? ;)
НЛО прилетело и опубликовало эту надпись здесь
Не поверите, но теоретически жизнь реальна и без Интернета вообще.
НЛО прилетело и опубликовало эту надпись здесь
На самом деле уже нет.
И дело тут не столько в фейсбуке сколько в том, что существенная часть механизмов экономики и военной безопасности держится именно на интернете.
Думаю как-нибудь перебьемся без интернета и механизмов экономики. Голивуд доказывает это в каждом втором фильме.
Мне кажется, что голливудские фильмы — не самый надежный источник информации.
НЛО прилетело и опубликовало эту надпись здесь
теоретически и за МКАДом жизнь есть
In theory theory and practice are the same. In practice they are not.
Теоретически, теория и практика должні совпадать. На практике же, они не совпадают.

:)
НЛО прилетело и опубликовало эту надпись здесь
Скайнет вообще должен был ударить сначала в августе 1997, но второй Т-800 с Джоном оттянули конец на 2004-ый.
Все прибаутки последних дней по поводу Скайнета — липа.
Неужели?
>From the information I have and to answer your questions, SkyNet did not have anything to do with the service event at this time.
Не, ну ясное дело — автора ответа уже в заложниках держат.
НЛО прилетело и опубликовало эту надпись здесь
Конечно нет, это Джон Коннор нанес превентивный удар. Дата опять отложена.
Среди сервисов, которые испытали и продолжают испытывать проблемы — Heroku, Quora, About.me, Foursquare, FormSpring, Lighthouse, Nvidia's Developer Portal, reddit, SpringPad.
Полный список пострадавших сервисов:
http://www.ec2disabled.com/
Кстати Foursquare возобновил работу примерно через час.
Остальные сервисы повесили fail-whale страницы.

Сразу стало понятно, кто делает бекапы, а кто уже делает бекапы.
Тут чуть сложнее.
Надо было делать бекап в другую Availability Zone.
Потому как бекапы у меня например были. Но забрать я их так и не смог из-за постоянных ошибок :)
Бекапы лучше держать на сторонних серверах.
Сказал я, и записал это себе в TODO-list. :(
… и разместил его на Amazon EC2…
Вот самое противное что пострадала только база и её рабочие ESB.
Остальные серваки нормально работают, несмотря на то что находятся в одной зоне.
а я как раз зарегался пощупать амазон, думаю чего это у меня инстансы не запускаются…
Доигрался?
упс…
вступите в Единую Россию пожалуйста
амазон забыл продлить домен?
Обидно за assembla.com, тоже пострадала. Только начал привыкать
По поводу Скайнета: есть версия, что запуск Скайнета не состоялся, так как они тоже хостились на Амазоне…
Значит все таки смогли вырубить =(
Либо забыли продлить свой скайнет-домен
Когда падают облака всех накривает туманом :)
fog of war?
blacksheepwall в помощь.
Для смертных знающих английский язык.
собственно, с технической точки зрения там ничего не объяснено. только сказано, что упали сразу несколько «зон доступности» («Availability Zones» якобы независимые ЦОДы или что-то в этом роде) в одном и том же регионе (восток США). почему? неизвестно.
И поэтому репозитории на Assembla.com тоже частично отвалились. Вот и накрылись все стартапы :)
Кстати умные рекламщики быстро сообразили и начали выкладывать в Твиттер по тегу #ec2 рекламу VPS и конкурирующих cloud-решений — RackSpace, elastichosts.
НЛО прилетело и опубликовало эту надпись здесь
я там прочитал про elastichosts.

Еще интереснейший твит был от @starbucks:
twitter.com/#!/Starbucks/status/61139468912041984
В этих ваших твиттерах пишут, что Амазон уже поднялся. Все сервера моей компании поднялись.
Статусная страница самого Амазона пока молчит.
Однако у assembla пока еще проблемы с репозиторяими :(
В такие моменты я могу им только сочувствовать. Никто и никогда не может дать 100% гарантии 100% работоспособности. Потому что любое резервирование имеет запас прочности и существует вероятность, что случится именно так, что не поможет.

Кроме того, есть человеческий фактор — вынутый невовремя или не тот кабель, ошибка в команде, ошибка в коде и т.д.
… garbage collector со шваброй.
НЛО прилетело и опубликовало эту надпись здесь
В цикле или по хрону запрашивать сервис на доступность, и если таймаут превысил нужный включать сирену через что-то вроде habrahabr.ru/blogs/DIY/112511/
Я настроил для этого консольную sip звонилку linphone которая при необходимости инициирует звонок на мой alarm phone в котором стоит громкая сирена в качестве звонка. Если интересно могу по пунктам рассказать, как чего настраивать.
НЛО прилетело и опубликовало эту надпись здесь
Рассказываю.

Делал это я для мониторинга LA на своем серваке. Звонилка тоже на этом же серваке живет, но ничего не мешает поставить звонилку на любой VDS чтобы она мониторила другие серваки.

Для начала настраиваем саму звонилку, вот подробный мануал: www.linux16.net/node/538

Только в качестве сип шлюза я выбрал voipdiscount так как у меня там был аккаунт. Кстати алярм звонки мне обходятся совершенно бесплатно. Время разговора 0 сек.

Настроив все по мануалу который я указал выше, я подправил под себя скриптик alarm.call

#!/usr/bin/expect -f
set timeout 60
spawn linphonec
expect "Registration on sip:voipdiscount.com successful."
send "call +your_phone_number\n"
expect "Connected."
set timeout 3
send "terminate\n"
expect "User is busy."
send "terminate\n"
send "quit\n"


И второй скриптик для мониторинга LA и инициирования звонка, который запускается по крону раз в пару минут:

<?php

$maxLA = 40;

if (getLA() >= $maxLA)
exec("./alarm.call");

function getLA()
{
$la = `cat /proc/loadavg`;
$la = explode(" ",$la);
return $la[0];
}

?>


Уже пару раз просыпался под веселые звуки сирены когда мой сервак умирал при странных обстоятельствах.
НЛО прилетело и опубликовало эту надпись здесь
Ну в начале я написал, у меня запущена звонилка на том-же серваке который она мониторит. Это, конечно, не правильно. По идее надо брать отдельный vds где настраивать звонилку и скрипт который будет мониторить аптайм серваков.

Просто для меня была задача мониторить только LA.
просто и надежно, возьму на заметку!
Сирена не сирена, а sms можно получить :) попробуйте monitorius.com или любой другой uptime monitoring сервис ;)
НЛО прилетело и опубликовало эту надпись здесь
Еще есть pingdom.com из простых и более-менее бюджетных (поминутная проверка, $10 в месяц + $0,45 за sms), год пользуюсь — доволен.
Как хорошо что у меня свой сервер.
Пострадавшим — сочувствую
Это, как бы, тоже не проблема для «бабушек с лопатами» или «банды экскаваторщиков».
Это Вы к чему вообще?
Вот
Ну, когда семля налетит на небесную ось — вообще все ляжет и все лягут.
Сколько чего не резервируй, а вероятность падения все равно остается. Не пойму почему минусят, разве иметь свой маленький ДЦ уже не комильфо? Я вот так не считаю. Живу себе свокойно, и если недай-бог чего падает — сам себе нехороший человек.
Но по сравнению с резервной площадкой у хостера — аптайм моих сервисов в собственном ДЦ куда дольше. За последние 3 года моя собственная площадка была не доступна два раза. У хостера — 5 раз.
Я не претендую на истинность. Лично мне так проще и дешевле. Аппетиты у меня скромные и своего облака из 8 лезвий мне пока хватает за глаза.
Э… вся ваша независимость заканчивается ближайшей подстанции. И да, дизеля на две недели будет тяжко покупать.

А ещё, если датацентр маленький, то есть соседи сверху с отоплением и ванной/сортиром.
На старой работе весь моск съели в своё время, что надо на амазон переезжать, чтобы клиентам всё было доступно 24/7. Там, мол, все круто и мы лэйбл добавим, что у нас всё на амазоне, клиентов привлечем этим.

А с месяц тому они всё таки переехали на амазон. Надо узнать задело их или нет, что ли.
Те сервисы которые держали критично важные серваки в разных зонах не пострадали. Или смогли быстро перейти на резервы
Узнал. они не в этом ДЦ обитают, их вообще не задело.
Ну тогда я спокоен :)
Учебная тревога от амазона прошла успешно. Кто не зареплицировался я не виноват.
НЛО прилетело и опубликовало эту надпись здесь
Мне понравился ответ от компании Quora — «We’d point fingers, but we wouldn’t be where we are today without EC2»
мы быстро починили, смонтировав ami образы с последнего backup EBS
хотя это все зависит от вашей архитектуры

пилим нормальный деплой через SVN и байбай EBS
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории