Pull to refresh

Comments 70

Есть пять регионов: очепяточка.
время простоя действительно поражает :(
Интересно, компенсации будут? Просто интересно как это у западных компаний поставлено. Наш Clodo говорят компенсирует каждый чих.
А убытки у клиентов Amazon, думаю более чем ощутимые.
Смотря, что в договоре написано, если прописаны все форс-мажоры и все нюансы, то конечно будут выплачивать простой и компенсацию прибыли.
В договоре прописано, uptime за последние 365 дней упал ниже 99,95% — пишите, ваш bill за месяц будет снижен на 10%. Думаю, я буду платить 90% еще месяца три.
Сервер лежит, я спокоен — сделать ничего не могу. Сначала он перестал отвечать, сайт выдавал ошибку подключения к БД (локальной), после перезагрузки перестало работать что-либо вообще и в логе после загрузки ошибки жесткого диска. Попробовал остановить — в состоянии остановки тот провисел часов восемь. Попробовал запустить — в этом состоянии он уже часов двадцать, я думаю.
Их инженеры не спали уже часов 40, я думаю, они воочию увидели пятилапого пса из Generation П.
Я никуда от них не уйду, дешево, удобно — разве что буду держать backup'ы snapshot'ов в другом регионе, к 15 долларам в месяц прибавится доллара два, не жалко. Да и, думаю, после такого — они из кожи вон вылезут, чтобы сохранить клиентов.
На всякий случай, еще раз: для них это катастрофа. Почитайте форум.
То, что причиной сбоя стали EBS — на самом деле забавно. Мы уже давно наблюдаем существенный спад IOPS'ов, но переезжать нам — это целая история. Вспоминаются «специалисты», которые для ускорения EBS советовали делать из 16 (!) дисков RAID0, мотивируя тем, что Amazon гарантирует их неубиваемость :)
36 часов простоя — еще один довод в выборе облачного провайдера. Год назад у гугла тоже были проблемы с доступностью, но из-за отключения электричества, правда масштаб бедствия сильно меньше. Поразила скорость реакции технического персонала. Ждем «ответа» амазона :)
amazon aws — это, да будет вам известно, мать и отец прародитель облачного хостинга. поверьте, google app engine то же страдает сбоями (как и microsoft azure), просто он не используется в таких масштабах, как amazon, поэтому его падения не вызывают таких бурных реакций.
Ага, как бы невзначай, и ни слова про Amazon. :)
Ролик очень Half-Life первый напомнил…
Интересно, у них такие «рекламные» ролики на все случае жизни сняты и их достают по-ситуации в Мире или они очень операвно их штампуют?
Я кстати довольно быстро смог восстановиться.
Об этом не писали почему-то. Но запросы на генерацию снепшота с EBS вольюма проходили, но очень долго. У меня был затык с БД. Часов через 6 я таки смог сделать снепшот вольюма с базой и восстановить работу сервисов.
Но возможно мне просто повезло со снепшотом.
Может из тех, кто попробовал разные облака, теперь подытожит, на чей сервис лучше смотреть-то? GAE? Rackspace? Clodo?
Практика показала, что упасть могут все. Вопрос в скорости поднятия и отношении хостера к своим клиентам (предоставлении информации об аварии, работа службы поддержки и т.д.).
зависит от круга поставленных задач.
селектел.
У вас как-то строчки не стыкуются. Сначала правильный ответ, а потом — не правильный…
Вообще если по принципу оплаты за закрепляемые ресурсы, то в этот ряд нужно добавить Slidebar, Scalaxy и Azure

Но все зависит от ваших задач, аудитории проекта, необходимости хранения и обработки персональных данных в России (эксклюзив у slidebar) и т.д.
UFO landed and left these words here
Ещё есть более новая версия
Идите на фишки.нет, а? Задрали уже все эти юмористы с картинками.
UFO landed and left these words here
аналогично, только это не зона, это регион. вам повезло.
Не упомянут в списке один из серверов ProjectLocker (гадство, как раз с моими проектами!), который тоже грохнулся, но сегодня его уже подняли. А вчера пришлось все по старинке на флешку в телефон закидывать.
>Судя по всему, распределённая база данных Amazon RDS использует секретные API

Я бы так не сказал: status.aws.amazon.com/ И вчера и сегодня с RDS были проблемы. Возможно вы имели в виду SibmpleDB?

Кстати, кто точно может сказать какие зоны падали?

>Причиной сбоя на самом деле стали дисковые массивы EBS (Elastic Block Store)

Помнится, кто-то недавно тесты проводил. Доигрались?
Падали все зоны. Потом довольно быстро (4-5) поднялись все кроме одной. us east-b до сих пор точно лежит. Остальные вроде работают нормально. Мы перенесли оттуда все данные в east-a, пока полет нормальный
Селектел и Скалакси — спонсоры перерывов обслуживания AWS. Их активная маркетинговая политика как минимум не опровергает этого замечания.
где-что надо почитать, чтобы
«хм… компания из Сиэттла, которая использует секретные API для получения конкурентного преимущества — звучит как-то знакомо?»
мне тоже стало занкомо?
11:50 по МСК Только я в консоли добавил порт в Security Group и спустя 5 минут главный сервер и RDS пропали вникуда. Пол часа попыток выяснить в чём дело кроме седины ничего не дали. Повисшая Restore To Time RDS и снапшот диска наводили на мысль, что что то не так у Амазона. Но нормально работавшие m1.small вводили в заблуждение.

~12:40 по МСК — амазон обновил свой статус о том что «заметил увеличившийся error rate и latency». Поуспокоились.

У нас сотня Gb пользовательских данных на S3 и около 4 Gb база в RDS. На EBS данных не храним.
Есть ночной дамп базы на S3, но это 8 часов потери.
Ждём, ибо вера в Амазон крепка, за ~1.5 года работы с ним — была пара кратковременных «глюков», по чьей вине которые случились — так и осталось загадкой. Стоит ли торопиться, восстанавливать БД и потерять данные, если Амазон «вот-вот» должен восстановиться.

А время идёт. Foursquare поднялся. HootSuite и все остальные продолжают лежать.

~17:00 по МСК. Обдумываем переезд в Калифорнийский регион. Становится понятно, что перенос S3 и перенастройка DNS — это до завтра. Оставляем зашглушку на сайте и идём по домам жать F5 на status.aws.amazon.com

Вечером ничего не изменилось.

С утра следующего дня обнаружил сообщение амазона о том, что восстановлена работа в 3-х из 4-х регионах.
Естественно та единственная зона — us-east-1b — это наша. Попробовал restore to tim rds в другую зону — о чудо, 20 минут и инстанс восстановлен. Нужный нам инстанс в этой зоне также создался нормально. Скорей на работу — переезжать на новый сервер.

Около обеда переезд закончили, заодно обновили версию приложения (теперь со злосчастным IE9 всё в порядке и мобильная версия появилась), обновили дизайн сайта и переехали наконец на Win2008 R2.

www.teamlab.com/ru — это мы

Менять амазон на что то другое в мыслях нет.
Стабильность в течении 1,5 лет до этого и удобство пока перевешивают этот «невероятный» сбой.
Имей мы Multi-AZ размещение — поднялись бы быстрее. Так и сделаем.

Сlaim оформим само собой. Подождём, пока ребята починятся.
Вчера так хотелось в проджект менеджере пару задач закрыть. А еще 1 внести.
Тык мык, а вы в дауне :)
Да, целые сутки простоя. Амазон выбрал лимит «недоступности» на 20 лет вперёд.
Теперь заживём спокойно ))
странна у меня на us-east-1b все работало, а 1c лежало
двое суток уже один из инстансов недоступен
Кстати, кто вменяемо объяснит преимущества облака? Судя по этой ситуации аптайм 100% не гаранирован и переезд не всегдаможно организовать по нажатию кнопки. Стоимость? Какие преимущества перед своим железом?
Стоимость. Очень тяжело нагрузить железку на 100%, чтобы использовать всё, за что заплатили. В случае же нормальных облаков вы платите только за то, что потребили (и поэтому, имхо, немного стрёмно, когда скалакси называет себя облаком при почасовой оплате инстансов).
Аптайм 100% вам не гарантирует нигде и не на каком железе никто, кроме Господа Бога, да и за него я сильно сомневаюсь.
Если бы у меня был бекап (3 клика с главной страницы и ввод имени бекапа) — я мог бы создать новую машину такой же конфигурации в любом из пяти регионов.
На все нужно смотреть сквозь призму решаемой задачи.
Мне нужен хостинг — наверное, можно было бы хостится у кого-либо от $2 в месяц, я предпочел иметь свой сервер — $15 в месяц, сейчас подумал, и купил за $82 reserved instance на три года, $2,27 в месяц, $0.007 в час (посчитал — прослезился, окупается мгновенно). А получаю, вместо хостинга, полноценную машинку с таким быстродействием, какого я ни в windows-серверах, которые администрировал, ни в своих домашних linux машинах, не видел. Например, удивляющая меня скорость доступа к дисками, даже на моей самой дешевой micro instance.
Другой практический пример — все приложения, архитектуру которых я умудрился узнать\выведать у разработчиков — хостятся в облаках, большинство тех, что видел лично я — Google App Engine. Замечательная по своему удобству штука, пиши код, и не думай о нагрузках — сколько бы не было пользователей, код будет корректно работать, только оплачивай счета.
И, да, в добавку к комментарию выше — в Амазоне я плачу за закрепленные за мной ресурсы, в GAE — только за потребляемые.
А какой мощности вы получили «сервер» за 2.27 в месяц?
Думаю человек говорит о том, что заплатив 83 доллара на три года вперед он получает micro instance за 0.007$ в час.
24*0.007*30=5.04$/месяц. 2.27 правда у меня не получилось, может он выключает ее на ночь?:) Несмотря на то что он немного темнит(диски, операции io и траффик тоже платные), это все равно очень недорого.

Micro Instance — 613 MB of memory, up to 2 ECUs (for short periodic bursts), EBS storage only, 32-bit or 64-bit platform
EC2 Compute Unit (ECU) – One EC2 Compute Unit (ECU) provides the equivalent CPU capacity of a 1.0-1.2 GHz 2007 Opteron or 2007 Xeon processor.
Там используется Elastic block store и он вроде как одинаковый для всех, независимо от тарифа(выше был коммент про то, что их можно объединять в рейды для увеличения скорости)
Micro instance. Почему-то не вставил ссылку, когда писал.
На счет цены — $82 / 3 года = $27,33 в год. $27,33 / 12 месяцев = $2,27 в месяц. Цена взята из ec2 pricing, я пересчитал — $82 / 3 года / 365 дней / 24 часа = $0,0031. Видимо, $0,007 указано для годового контракта, 54$.
Ах так вы пока считатель, а не юзатель:) Тогда спешу вас разочаровать.
Reserved Instances give you the option to make a low, one-time payment for each instance you want to reserve and in turn receive a significant discount on the hourly usage charge for that instance
По-русски — 82 доллара — плата за скидочную цену 0.007$ за час(вместо 0.02 в случае micro instance).

Там же и калькулятор есть. calculator.s3.amazonaws.com/calc5.html
Да, намудрил, получается $82 / 3 года / 365 дней / 24 часа + 0,007 в час = $0,010 в час с учетом начального платежа. Ровно в два раза дешевле, чем без резерва.
Большое спасибо, что помогли разобраться
Вдогонку: если вам интересно, вот результат ab в 10000 запросов в 100 потоков. Загруженность процессора не поднималась выше 10%, подозреваю, время уперлось в скорость жесткого диска.
При таких настройках я могу выдержать хабраэффект, главное — грамотно пользоваться кешем (множество интересной информации по теме).
Сервер за 2.27 выдерживает хабраэффект? Напрашиваетесь на экперимент
Я напишу об этом, думаю, будет интересно. А сервер, как выяснилось выше, обходится мне в $7.44 в месяц ($89.28 в год, соответственно 208 и 2501 рубль по сегодняшнему курсу без учета трафика) при наличии резерва на три года.
Тщетно попытался заснуть, и вот, третий час сижу пишу. Обещаю статью в две недели, в эту либо следующую пятницу (протестировать нагрузку, да и нужно перелопатить сотни килобайт текста).
Единственное неудобство — почему-то теперь все блоги стали коллективными, и для написания в них нужно пять кармы — в итоге, я не могу даже сохранить черновик (что совсем странно), приходится писать в не очень хорошо работающем хабраредакторе и сохранять текст вручную в evernote.
Посильно поучаствовал, получилось как раз 5. Надеюсь, остальные «закрепят» результат.
Ждём статью!
А по-моему ничего интересного не будет. У вас сейчас вдс с одним ядром и полугигом рам. Способна она ровно на то, на что способна вдс с одним ядром и полугигом рам. В отличие от клодо и др. она не будет scale-ится при нагрузке(амазон использует принцип запусти побольше инстансов, а не расширяй свой). Единственное чем вы сможете всех удивить это счетом за траффик:)
Что вы все называете эту маленькую вдску сервером? Ну хватит:)
облако — это такое место, которое наступает для вас, когда вы уже нифига не помещаетесь на шареде/слабеньком впс, но еще нифига не окупаете нормальный сервер + вы не знаете, как быстро будет расти клиентская база и нарузки.

с облака есть три выхода:
— на кучу своих серверов со своими матерыми админами
— на старое место
— /dev/null
какой-то желтушный заголовок и не отвечает содержимому, правильней было бы написать «что и как упали небеса». ответа на вопрос «почему» нет.
UFO landed and left these words here
в оригинале заголовок такой же. я понимаю что переводчик просто перевел как было, и в предыдущем посте был камень в огород оригинальной статьи, а не перевода. нафига было минусовать? (пысы: статью я кстати не минусовал).
UFO landed and left these words here
Нормальный заголовок. Там выше ссылка, что лежат, к примеру, сервера компании по мониторингу людей с сердечной недостаточностью. Для кого-то это трагедия.
Согласен, что это плохо, но причем тут мой камент?
(с технической точки зрения, подобные системы (имеющие непосредственное отношение к жизни и здоровью людей) должны проектироваться с учетом возможности отказа любой подсистемы, и уж тем более отказа удаленных систем со связью через каналы общего пользования (интернет), которые никакой надежности вообще не гарантируют. и их отказ не должен быть трагедией)
Самое забавное, когда год назад были проблемы у макхоста, у hosting.ua и других — многие нахваливали Амазон в стиле «а я вот переехал в облако и не парюсь». Какая цикличная все-таки штука — история!
Если бы она был по-настоящему циклична, то мы бы тут видели комментарии типа: «А я сижу на нашем валуйхосте и радуюсь».
Один сбой произошёл у Амазона, а вы его уже загнобили. Просто загнобили до ужаса. Ваши макхосты и хостинг.уа курят в сторонке, их даже с Амазоном сравнивать смешно. Посмотрев на аптайм амазона, я думаю, они из кожи вон вылезут, лишь бы такого больше не повторилось. И я верю, что так будет.
на макхостах и хостинг.уа хостятся одни хомяки-визитки. а AWS пытается себя позицинировать хотя бы как частичную, но замену полноценной собственной инфраструктуре. а после таких аварий, доверие ко всем SaaS очень падает. что есть впринципе хорошо.
Массивы EBS могут быть только в одной зоне доступности и доступ к ним может идти только из этой зоны. Судя по всему, распределённая база данных Amazon RDS использует секретные API, позволяющие получать доступ к EBS из других зон, но эти интерфейсы не доступны никому, кроме RDS (хм… компания из Сиэттла, которая использует секретные API для получения конкурентного преимущества — звучит как-то знакомо?)


Секретные API для Amazon RDS по использованю Amazon EBS? Вы, должно быть, шутите.
прим. пер.,

Я так понимаю, в качестве «пер.»-а выступил промпт? Или все-же гугл транслейт?
Не в обиду будет сказано, но вторую половину статьи читать просто невозможно. А жаль, тема интересная.

Sign up to leave a comment.

Articles