Pull to refresh
36
0
Send message
Multipath не нужен в силу архитектуры продукта, можно использовать обычный бондинг для большей отказоустойчивости отдельной ноды хранилища.
Описанный подход прекрасно работает, если совмещать его с дисковым бекендом, позволяющим делать атомарные снимки — у нас в Flops.ru бекапы создаются именно таким образом, при этом использование открытых компонент позволяет получить желаемое бесплатно. Единственный недостаток такого подхода — файловые системы, которые отказываются фризиться по каким-то причинам, в БД-ориентированном шаблоне это может обходиться выносом datastore БД на отдельную (эксклюзивную) точку монтирования.
Еще один момент — не припоминается ни один LFN-оптимизированный алгоритм, который бы подошел к этой задаче на сто процентов. Это не к вопросу о вытягивании нюансов, просто интересно, существующий используется или свой.
Вы используете TCP транспорт для этих целей или что-то иное? RTT в 5мс будет очень сильно ограничивать возможности синхронных операций для профиля нагрузки с резкими всплесками записи, так что эта затея по большей части малореальна на приличном ио из-за фундаментальных лимитаций.
У хадупа другие задачи и возможности, впрочем, авторы статьи могут сами перечислить различия. Экосистема Nutanix довольно близка к нам (Flops), где-то он существенно нас превосходит (в плане интеграции протоколов хранилищ и локализации данных), где-то наш стек умеет то, что в nutanix не реализовано вообще (SDN, к примеру).
Судя по всему, в платформы, которые не понимают что такое ULLtraDIMM их не вставишь? Или работа с ними будет на программном уровне?

В доках писали что нужна поддержка UEFI.
Подсчитайте на досуге вероятность проявление ошибки в non-ECC памяти, на какие приложения это может повлиять, а также про методы контроля данных как в системе, так и в приложениях.

ECC не только исправляет ошибки, но и позволяет обнаруживать бракованные/склонные к ошибкам планки. Имея не-ECC память, вы фактически не имеете средств диагностики таких ошибок. При этом симпоматика у них такова, что причина (битая планка памяти) будет ясна далеко не на первом фейле. Ну а когда поймете, что виновата память — придется гонять мемори-тесты, чтобы понять какая именно планка фейлит.

Зачем горячее резервирование электропитания на сервере? У вас проблемы с электропитанием? у вас часто выходят из строя БП?

Во-первых да, БП горят, это нормально. Во-вторых, что не менее важно, качественные ДЦ предоставляют две независимые линии питания, и даже если по одному лучу питание пропадает, оборудование продолжает работать.

В принципе, этих аргументов достаточно, чтобы понять, что консьюмерское железо не стоит использовать там, где от аптайма зависит финансовый результат компании.
У них т.н. shared private network, которая не изолирована между клиентами. По большому счету единственное, чем она может быть полезна — это возможностью бесплатно гонять трафик между машинами. Можно конечно вооружиться iptables и самоизолироваться, но полноценной локальной сети получить все равно не удастся.
Не понял, где тут хайлоад

Как мы отметили в начале статьи, все относительно и данный проект не претендует на рекорды. Тем не менее, решаемая клиентом проблема ненамного слабее C10K, да и характерные для хайлоада проблемы уже встречаются.

и где тут облако в понимании облака. Просто поменялось место расположения виртуалок.

Рестарт машины при вылете хоста (High Availability), возможность за секунды создавать/клонировать/удалять виртуальные серверы, возможность подстроить конфиг без рестарта сервера, приватная локальная сеть — это все про облака.
Спасибо, приятно слышать :)
Вообще сложно представить задачу, когда нужно _столько_ памяти.

72Гб памяти — это суммарная потребность в памяти вообще всех приложений (включая несколько Windows-машин). Не беремся судить, насколько это потребление оптимизируемо, т.к. это лучше известно самому клиенту. Но предполагаем, что раз клиент этим не занимается — наверное стоимость оптимизаций будет для него выше, чем переплата.

Юр. лицо для оплаты с российского юр. лица не требуется, если речь не про гос. организацию. Все уже давно списывают это на «другие расходы» или «услуги связи» и платят корпоративной картой. Там есть вполне законные схемы (как бы они не отвалились в 2016-м, но пока всё хорошо).

Описанная схема работает только для УСН/ИП 6%.
Для всех остальных есть два варианта. Либо ваша компания заводит счет в евро и платит зарубежному контрагенту безналом (что сопровождается валютным контролем, высокими комиссиями за перевод, абоненткой за валютный счет итд), либо вы не имеете права списать данные средства в расходы.
Опять голословные утверждения. Подсчитайте на досуге вероятность проявление ошибки в non-ECC памяти, на какие приложения это может повлиять, а также про методы контроля данных как в системе, так и в приложениях.

Голословные утверждения — это ваши мифы о том, что консьюмерское железо равноценно серверному по надежности. Разница ECC и не-ECC это один из многих факторов отличия. У консьюмерского нет горячего резервирования БП, никто не тестировал его на возможность бесперебойной круглосуточной работы, неизвестно, что там будет с охлаждением при многочасовой «прожарке» CPU, отсутствует IPMI… Можно найти много отзывов на предмет hetzner'овского low-end железа, в том числе от хостеров, которые продавали на таком оборудовании VDS и в итоге отказывались от этой практики именно по причине непредсказуемости.

По грубым прикидкам аренда этого сервиса (нагрузка чуть выше обычного сервера хостинга ) в Европе будет не дороже 15k рублей. Эту сумму можно оплатить или как физ. лицо или через 10-к посредников (+20%-40%) как юр лицо.

Дороже. См. выше.
Если смотреть на требования к конфигу в данной конкретной задаче (72+ GB RAM, 2TB быстрого диска), то речь может идти либо о PX120, либо PX120-SSD c кастомной конфигурацией дисков. Итоговый прайс за 2 сервера — в районе 25 тысяч рублей, плюс что-то нужно будет делать с каналом/трафиком наверное. Так что не могу сказать о существенной разнице.

По поводу юриков — у них есть российское юр. лицо то бишь?
Будьте добры, более подробно привести аргументы.

В случае, если у вас есть 2 dedicated сервера (каждый со своим сторейджем) вы конечно можете попробовать организовать горячий резерв, настроив репликацию БД и подняв фейловер для каждого сервиса. Но это повлечет расходы на работу админа, необходимость постоянного контроля и периодических проверок работоспособности. И все равно не будет гарантий, что в час X все отработает так, как нужно.

В случае облака все гораздо проще, т.к. все инстансы хранятся в shared хранилище и при аварии одного сервера та же виртуальная машина перезапустится на другом хосте без вашего участия.

Также непонятен, в чем экономический эффект, если арендованные сервера и VPS в Хетзнер, ОВХ и Онлайн.net довольно доступные по цене.

Что касается Hetzner. Если речь об их бюджетном железе, то оно консьюмерское (Core i7, non-ECC RAM) и использовать его для подобных задач себе дороже. Если выбирать и конфигурировать Dell'ы, то в итоге прайс будет сопоставим. При этом вы получите серверы расположенные в Европе (то бишь пинг будет десятки миллисекунд) и у вас не будет возможности платить за услуги с юридического лица (что актуально, когда ежемесячный счет за хостинг — несколько десятков тысяч рублей). Вывод — вариант так себе.
В этом случае можно сравнить отклик — у нас 99 процентов такого теста уложатся в 2-5 мс, что вряд ли возможно на счетверенном сасе. 400 IOPS записи для минимального инстанса — вполне себе хороший предел, никто даже близко к нему не подбирается в реальных задачах. У нас нет задачи продемонстрировать цифры с многими нулями, задача скорее сделать работу приложений очень быстрой. Выбранные параметры лимитов вкупе с низким откликом эту задачу решают настолько же успешно, насколько и сырой массив из SSD с соответствующим прайсом.
1. В любом случае они не могут отдавать такую полосу всем клиентам, значит, это очень большой оверкоммит, только и всего. Детали архитектуры, в принципе, ищутся в гугле, я не хочу выступать адвокатом дьявола и «мочить» то, о чем не знаю деталей, но выводы после просмотра разрозненных подсказок можно определенные сделать — и по лимитам, и по будущим потенциальным сложностям. Даже если ничего не искать, голос разума подсказывает, что те огромные цифры, которые выдаются на бенчмарка диджиталоушена, точно не могут равномерно раскладываться по всем клиентам.
2. Это своего рода этикет — к нам, например, открыто пришел работник конкурирующего продукта, взял самый крупный инстанс на тестовом периоде и нагрузил его по самое не хочу по всем характеристикам, заявив потом, что у нас все плохо :). Cрезать скорость в середине тестирования, наверное, самый большой удар по репутации, кроме собственно падений, потому я понимаю причины, почему у вас итоги оставались постоянными.
Вы поймали лимит, то есть ограничение по иопсам. Цифры с диджиталоушена говорят только о том, что у них ресурсы лимитируются с очень большим оверкоммитом или не лимитируются вообще, поэтому намерянное не будет гарантировано. Минус в том, что на эту удочку клюют многие и несут свои сайты туда, где цифры в тестах выше, невзирая на логику — всем такой объем ресурсов одновременно не отдать, а пиковые значения могут меняться на порядок в зависимости от загрузки дискового ресурса соседями. В данном случае 10к IOPS — значительная часть ресурса приличного хранилища с многоуровневым кешированием. Мы выбрали другой путь — цифры удивляют меньше, зато они не являются пиковыми, то есть не будут меняться со временем, хоть и в каком-то смысле это идет в ущерб маркетингу.
В чем повод для беспокойства? Никто из атакующих не будет запускать такую конструкцию, она обрушит ему же канал на стыке с ближайшим сетевым устройством.

Information

Rating
Does not participate
Registered
Activity