@Metrika4215 сен в 14:15

ESOS + Hyper-V: как добиться отказоустойчивости СХД когда «из коробки» её не было

Средний

9 мин

6.6K

Системное администрирование * Серверное администрирование *

Из песочницы

Комментарии 9

@V-core 15 сен в 18:24

Поясните пожалуйста

Где стоял еsos?

Схд не видна из hyper-v?

Если предположить что у вас куча дисков и всего 2 ноды можно построить кластер и без схд.

@Metrika42 16 сен в 14:48

ESOS установлен на СХД AIC

в Hyper-v не видна, диски от СХД добавлены в хранилище, в Диспетчере отказоустойчивости кластеров

Если построить кластер без СХД, то в случае выхода одной ноды, не будет быстрой миграции на вторую, и мы лишаемся отказоустойчивости.

@KNT 15 сен в 18:50

Осталось зарегистрировать юр. лицо и можно продавать отечественную SDS

@falcon4fun 15 сен в 20:02

даже самая простая система может стать по-настоящему надёжной

Апхахахааха. В деда мороза тоже верите? А в Йетти?
Hyper-V - раз. Два - какое-то говносторадж. Зачем-то FC.
Еще и Броадком, мой любимый. Люблю, когда из-за отказа вентилятора на сетевухе кидает CPU IERR и ошибку PCIE слота (часто без указания, чтобы все поперебирать). Ничто так не бодрит по утрам. А драйвера то какие. Закачаешься. На пару с фирмварами. Когда скучно жить и можно играть "в угадай что сегодня пошло не так"

Какая-то дикая дичь (и то, если очень тактично стесняться в выражениях), на которой я бы даже лабу не развернул.

Первое: MSA Gen4-Gen5 стоит на сдачу с пачки сухариков за базу на вторичке. Да даже Gen6 стоит примерно ничего новый. С гарантией и джибиками.

Второе: Hyper-V и отказоустойчивость? Удачи. Просто за ручки возьмитесь там и поищите ее. Сложно перечислить все причины по которым умеет падать Hyper-V WSFC:

Виртуалка, вставшая раком, которая ни в какую не мигрируется. И еще из-за которой не работает Live Migration, т.к. вмки рестартуют при миграции, и только Quick Migration вариант. Весело бывает 100 виртуалок и овнершип CSV выносить
Отвал CSV по рандомным причинам, вроде высокого латенси одного из дисков, например, после бэкапа Вимом (баг 5-ти летней давности)
Отвал CSV просто потому что переименовал маунтпоинт не с овнер ноды, а потом решил снести пустой CSV - за компанию отваливаются соседние CSV, просто потому что.
Отвал CSV просто при миграции овнершипа на другую ноду.
Заглючившая ВМка может снестись вместе с RHS-ом, унеся жизнь еще 3-4-5 десятков ВМок (а порой и всей сотни), на пару с отвалов CSV.
Шанс примерно 1 к 10, что при отвале сети около минуты, оно не крешнет VM World-ы всех ВМок и ВМки нормально оживут, а не выпадут в "Paused-Critical", даже со всеми твиками iSCSI и MPIO согласно Best Practices вендров.
Шанс примерно 1 к 5, что при отказе одной ноды все нормально перезапустится на второй ноде без каких-либо косяков.
И прочий миллион причин, который я видел за свою жизнь. Казалось бы - ну нечему падать уже больше. Ага, ага. Hyper-V - это ESXi.
Продолжать?

Третье: 2 ноды. Ну ок. Промолчу. Чего не одну то?

Четвертое: На MSA еще и афтермаркет гарантия будет. А на это говно - нет.

Пятое: MSA работает без бубна. Имеет также тонну документации и кучу форумов.

Шестое: Какой-то ESOS посос в засос. Писос в целом.

Седьмое: FC. Осталось к этому купить свитчи и найти нормальных сетевиков, которые хотя бы смогут настроить FC. Тут в iSCSI порты no-drop прописать не могут всякие сетевички, просто загуглив "BP iscsi". А здесь FC.

Не, ну если цель клиента или фирму сделать на 146% зависящей от тебя - вы справились с задачей. У коллег также кондей в серверной по 10 раз ходят заправлять за 2 года. Обслуживающая организация спит уже походу на мешке с евросами только на одной такой фирме. Зачем же эту золотую трасу менять и сами блоки?

Придя в любую компанию и увидев это костыльное нечто собраное кем-то на коленке, выкинул бы нахер, купил бы MSA x050/x060, напихал дисков, настроил и забыл. А на этот колхозняк еще 20 ректальных свечек придется поставить при плановом мейнтенансе или блэкауте: поднимется или нет, когда в реальном мире можно выдернуть из Компеллента кабель питания (один из двух БП), а оно сделает "у меня лапки" и вырубится к херам (Реддиту привет. И моим знакомым из одного ДЦ - тоже. Экспиренс незабываемый)

Примерно такой же уровень колхозняка видел, когда в одну фирму пришел и увидел NetApp подключеный прямым коннектом в серваки и ответ бывшего админа "ну тут это, чо-то фейловер ниоч как-то работает УЖЕ КАК 8 ЛЕТ. Не ну в целом то работает ж.".
"Ниоч" оказалось "не работает вообще". WSFC и MSSQL просто раком встает, если выдернуть один из контроллеров. Оказалось ни в одной документации нет того, что сторадж можно подключать прямыми линками в сервера, но прошлый админ решил "я лучше знаю"

З.Ы. Даже при учете всей хардвары этой говнины, я крайне сомневаюсь, что она выжмет стабильные 50-80к 4К IOPS.

стоит ли нести это в прод?

В голос. Пристрелите эту больную клячу. Пусть умрет спокойно.

Какие компоненты вызывают больше всего доверия/опасений?

Ээээ. Все? Там еще видел кастомные сервера фигируриют. Я уже точно не хочу знать, что там за больные и убогие. Надеюсь, хоть не фул тавер

Какие тесты обязательны перед выкаткой?

Справка из наркодиспансера. Справка от психолога. И результат теста на IQ.

Какие альтернативы предложили бы вы?

А в анкете надо отвечать честно или чтобы поржать? :D

@LabsTech 17 сен в 07:54

Оборудование на вторичке это лотерея, в которую можно и не выиграть
HP ушел из России, т.п вам будут оказывать менеджеры, которые вам продали msa из серого импорта.
У меня все!!!

@krids 17 сен в 09:39

HP ушел из России, т.п вам будут оказывать менеджеры, которые вам продали msa из серого импорта.

Покупайте у нормальных системных интеграторов (а не у перекупных "рогов и копыт") и т.п. вам будут обеспечивать его сертифицированные сервисные инженеры (в том числе из ушедших вендоров) и даже on-site.

@falcon4fun 19 сен в 13:14

Вы же не маленький мальчик и купите с афтермаркет гарантией, а не на Авито и других дно-площадка? :)
Например, последние 2 купленные фул-пак R640: 400 евро, как я помню, гарантия за каждый стоила на 2 года.
За 2 года в каждом поменяли мать (сломались фиксаторы рамы). Поменяли всю раму в каждом на другую, т.к. стоявшая слишком часто коррекции ошибок делала. Великие деньги. С возможностью продления

В догонку: за "лотерею" ты платишь 5к за фулпак сервер, вместо 30-35к. Если фирма-нищеброд или просто недостаточных маштабов - не вижу проблем в рефубе.
С каких пор на Хабре только Россия представлена? :) Это раз.
Два. Опять афтермаркет гарантия любого из видов существует:
1. Pickup and Return
2. Next business day support and 5x9 on-site
3. 24/7 with 4h reaction time and on-site support

Наверное, плохие условия. :D К тому же, я прекрасно знаю крупные фирмы, которые, как взрослые мальчики, покупают у стороннего вендора доп. гарантию на все сервера после их EOL/EOSL, когда у офф. вендора их купить больше нельзя.

З.Ы. Забыл. Если брать с онсайт-суппортом, суппорт вам предоставит кто-нибудь из местных, даже если сама гарантия например глубоко за бугром. У них обычно договоренности с какой-нибудь ИТ конторой.

@electedfx 17 сен в 18:18

А чем ceph не угодил?

@Metrika42 18 сен в 09:34

В первую очередь была важна высокая производительность баз данных, которую обеспечивает решение с СХД. В решении с Ceph есть зависимость от сети, нагрузки на кластер и прочие вытекающие, что влияет на задержку (основной акцент - работа с 1С).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий