Как стать автором
Обновить

Комментарии 66

11 Mb картинок с разрешениями по 2000px, сжатых в 16 раз css-ом? Издеваетесь?
поправили
Они все похожи, впереди диски, сзади два контроллера :-)
По вашей логике и машины все одинаковы — четыре колеса и кузов:)
Видимо давнее партнерство IBM и Netapp отразилось на этой модели. Хотя enclosure все равно все оемят у какого нибудь дотхила.
НЛО прилетело и опубликовало эту надпись здесь
Оно распалось то совсем недавно, эта модель явно имеет общие корни со сторвайзом. Вот еще управлялку бы нам показали авторы топика…
По окончании нашего тестирования будет выпущен еще один пост. Мы обязательно включим в него рассмотрение операционной системы для СХД NetApp SANtricity.
НЛО прилетело и опубликовало эту надпись здесь
Да какой уж тут секрет ;-)
E-серию раньше производила Enginio.
Я так понял, что Engenio (ну или NetApp для линейки E) делает «от себя» только контроллер в некоем унифицированном конструктиве (он, BTW, называется SBB), а Xyratex производите «железную коробку» с бэкплейном и блоками питания, под SBB-контроллер, и производит он ее для множества разных производителей, поэтому многие entry-level стораджи так похожи, так как удобнее и дешевле взять хорошо отработанную и качественную готовую коробку-конструктор, а самим разработать в нее только «потроха».
Такая вот «международная кооперация» и глобализьм.
E-серию NetApp в свою очередь много кто OEMит. www.netapp.com/us/partners/e-based-oems-list.aspx Там, кстати, есть две российские компании. Если не изменяет память, раньше среди партнеров еще и Dell был.
Он вроде и сейчас есть, по крайней мере Dell Powervault MD3 — это он.
Они все похожи, впереди диски, сзади два контроллера :-)
А таймауты на запись при скидывании wafl и автоудалении снапшотов аггрегатов уже починили? А то, вроде бы, серьёзная контора, большие деньги — и такие детские нелепые ошибки в коде.
НЛО прилетело и опубликовало эту надпись здесь
В какой версии DOT эта бага появилась? Есть ли номер?
Как подсказывают выше, E серия у кого-то там куплена была, там нет вафла. А точные кейсы поднимать лениво, на какая-то относительно свежая восьмёрка в 7 mode. По слухам, самым эпичным этот баг просирался в момент, когда удаляли ~300 раз дедуплицированные vdi'ки из-под vmware, я наблюдал при куда более прозаических обстоятельствах. Самым охренительным в этой истории, конечно, был не баг, а реакция саппорта «о, у вас нет perfstat на момент шестиминутной задержки на запись? Ах, ничем не можем помочь, если случится снова, соберите перфстат, тогда и приходите».

После этих историй все завывания про надёжность со стороны netapp'а звучат не убедительно.
Разницу между E-серией и FAS я знаю.
А по поводу бага, я так понимаю вас больше интересует возможность написать, что вы слышали что-то кто-то столкнулся с какой-то проблемой и на основе этого сделать вывод, что NetApp не надежен.
Нет, я лично видел, как инсталляшка весело обсыпалась. Про vmware-сценаоий мне потом рассказывали другие счастливые пользователи.
Какая инсталляшка? Теперь о чем речь-то?
Мне вам номер кейса написать?
К всем кейсам у меня доступа нет :( Так что пригодился бы номер бага.
Уловка 21: Бага нет, потому что у него нет номера. Так как бага нет, то кейс закрывают. Так как кейс закрыт, баг не имеет смысла заводить.
Все-таки не стоит жаловаться на техподдержку NetApp из-за того, что не смогли предоставить им perfstat. Это как в ГАИ доказывать, что ты не ехал на красный, не имея при этом записи с видеорегистратора.
Нет, извините. Perfstat'ный скрипт не приспособлен к непрерывному сбору данных, ээто раз, два, от «водителя» требуют не видео регистратор (логи есть), а подключенный диагностический компьютер.

Причём на момент внедрения о нем молчек, и только после аварии — ну вот будут перфдвта — тогда и приходите.
Вопрос борьбы с техподдержкой всегда актуален :) В крайнем случае кейс всегда можно эскалировать на уровень выше. Обратиться к дистрибьютеру или в представительство вендора, чтобы поддержали в решении проблемы.
Да, да, да. Я для себя нашёл более эффективное решение — не иметь дела с нетаппом вообще. За такие деньги и так позорно сыпаться…
НЛО прилетело и опубликовало эту надпись здесь
А если сыпятся оба, то зачем платить больше?
НЛО прилетело и опубликовало эту надпись здесь
Коробочное решение, раз в десять дешевле нетаппа. Стоить будет дешевле, сыпаться в неожиданных местах под неожиданной нагрузкой будет так же.

С учётом стоимости нетаппов, любой СХД стартап его уделает по цене за иопс/гигабайт в пух и прах. Если бы при этом netapp был роксолид, было бы понятно за что. А так — то же самое — «ну когда он у вас навернётся и если вы сумеете нам этот баг хорошо поймать, то мы может быть его пофиксим, если вы умеете с саппортами правильно разговаривать».
НЛО прилетело и опубликовало эту надпись здесь
Мужики много чего покупают. А почему бы не купить-то, если дорого? Крупная компания, офигенный IT-бюджет. Мы что нищеброды, чтобы покупать задёшево то, что можно купить за солидные деньги? И если навернётся дешёвая штука меня спросят — почему ты купил дешёвку? А вот если навернётся дорогая штучка, то вендор наверняка подскажет ещё более дорогой вариант, который можно будет показать директорам, и они, пожадничав, отстанут. А с большой вероятностью этот ещё более дорогой вариант показывали с самого начала, то есть всегда можно будет неявно так намекнуть, что они нищеброды и сэкономили, и тогда все взятки гладки.

НЛО прилетело и опубликовало эту надпись здесь
Ответа на вопрос, который не был задан? (предыдущий комментарий, на который я отвечал, не содержит вопросительных знаков).

Если же про общее впечатление — надёжность netapp'а явно ниже, чем прайс на его. В свете радикального удешевления SSD wafl теряет свою привлекательность для записи, а появление таких игроков как redhat с ceph'ом ставит netapp в неудобное положение в вопросах availability.
НЛО прилетело и опубликовало эту надпись здесь
При цене за 6-ки порядка $1kk (да, мне сейчас расскажут про дисконты от GPL, но подобной фагготрией занимается не только нетапп), вы же понимаете…

Но, хотите список? Держите.

* Violin Memory
* Nimble Storage
* Pure Storage
* Virident
* Qumulo

Заметим, сравнивать придётся в условиях обкакавшегося netapp'а.

Ах, да, можно ещё вспомнить NBD доставку вылетевшего диска, когда курьер сказал «не, так далеко (80км) мы не возим» и доставку пришлось ждать больше недели. Впрочем, это всё ерунда на фоне обкаканного волюма.
НЛО прилетело и опубликовало эту надпись здесь
Конечно, очень жаль, что вы столкнулись с такой проблемой при эксплуатации дисковых массивов NetApp, бага которую вы описываете имела место быть в определенных версиях онтап. На текущий момент она пофикшена. А обсуждение проблем, связанных с массивами FAS серий, актуально для соответствующего блога. Данная тема не имеет отношения к FAS, wafl и указанной выше проблеме.
Бага была пофикшена? А можно номер KB? Мне просто для любопытства.
Не обязательно информация об исправленном баге будет предоставлена в виде KB, но можно поискать по ссылке kb.netapp.com.
И еще раз отмечу, что данный пост — не место обсуждения багов FAS.
И в фиксации багов важна воспроизводимость. Т.к. это слухи, уверены что проблема была именно по вышеописанному сценарию? Проблема повторялась после этого или нет? Если повторялась, то почему perfstat не собрали? Если не повторялась, то почему грешите что NetApp такой плохой? Были ещё какие-то предпосылки?
Проблема повторялась три раза. Воспроизвести по запросу не могли, и, разумеется, саппорт сказал «у нас всё работает, а вы идите перфстат нам собирайте».

Скажите, каким образом можно собрать перфстат, когда вся «авария» занимает от двух до шести минут и происходит раз в 2-5 месяцев? Иметь постоянно запущенным perfstat? С учётом, что это тупой шелловый скрипт, который не умеет работать демоном, вопрос звучит как насмешка.

Впрочем, вот данные.

лог: hostname: NwkThd_00:warning]: NFS response to client IP for volume 0xID (volumename) was slow, op was v3 write, 232 > 60 (in seconds)

support case #2004159264

Саппорт сказал, что «это у вас диски такие медленные». Ага, ага, на 232 секунды операции записи. Лол.
Довожу до вашего сведения, что вопрос давно разрешен после выполнения рекомендаций вендора, заказчик более не обращался с подобными симптомами.
Если мы об одном и том же заказчике, то нет, проблему не решили. На саппорт нетаппа просто забили и поставили эту штуку на упреждающий мониторинг.
>после выполнения рекомендаций вендора, заказчик более не обращался с подобными симптомами.
Это и называется «забили на саппорт».
Не забили, а выполнили рекомендации и больше такой проблемы небыло.
Вы же сами только что написали «больше не обращался с подобными симптомами». Если мы про одного и того же заказчика, то я говорю, что там было — забили на бесполезный саппорт и больше не обращались с подобными симптомами, обложив железку мониторингом по самые уши.
Если проблема не повторяется после выполненных рекомендаций, то она или решена полностью или созданы условия чтобы она не повторялась.
Вы специально подменяете «больше не обращаются в саппорт» на «проблема решена»? Напоминаю, что рекомендации были «собрать perfdata во время следующей аварии», а потом рассказ про то, как 5-минутная задержка на IO была вызвана медленными дисками.

И нет, я не планирую соглашаться с примирительным «заказчик с проблемой больше не обращался, значит netapp сияет стабильностью». Строго наоборот. Баги — это, конечно, ужасно, но понятно. А вот действия саппорта, включая эскалейт — непростительны.
Георг, вы упускаете несколько деталей.

1) Вым были даны две рекомендации 2) просили создать лабораторию и повторить проблему.
И уж потом третий, самый крайний вариант, если первые два вы не можете/не хотите/не можете выполнять — это дождаться ситуации или спровоцировать её под вашим контролем и снять перфстат.

Если вы не хотите снимать перфстат, у вас были ещё варианты.

Дайте мне контакты человека который утверждает, что проблема до сих пор повторяется.

И в личной переписке я уже третий раз прошу вас закончить публичную переписку.
Перечитал переписку. Цитирую: (Q — компания, A — саппорт нетаппа)

Q) How about 'crash reproduction'? I think (name) sent you scenario for laboratory. If not, I'll ask him to send them.
“(name) says it can reproduce problem by deleting data with high level of deduplication (ask (name) for details), so problem is reproducible (but not exactly with our product conditions).”
A) I have checked with other resources here and we have come to a conclusion that we cannot reproduce this in the lab here.

Внимание: саппорт написал «and we have come to a conclusion that we cannot reproduce this in the lab here».

А потом тут мне рассказывают, что предлагали воспроизвести в лабораториии, а компания отказалась. Ну-ну.
Вы всё ещё пишете в публичном доступе.
Вот именно. Если проблема не может быть повторена, значит вы не знаете в чём проблема на самом деле.
Это означает следуйте рекомендациям сапорта.
Я перечитываю рекомендации. Цитирую:

«We made recommendations early last month for load to be moved to faster disks and to fix the misalignment. You are still on the 10k drives and fixing the misalignment was said to be not possible by you.».

1) В ответ на жалобу IO timeout в 360 с мне предлагают переехать на 15к RPM диски. Прокомментируйте снижение задержки после смены типа дисков.
2) Я им писал, что «misaligment» это обычное обращение используемого ПО, читающее 512-байтные блоки службеных данных, раскиданных случайным образом. Основные данные выровнены.
В самом начале вы забыли упомянуть об этой и другой рекомендации.
А сказали, что вас заставили ждать когда снимиться перфстат.
Ах, да, спасибо.

Исправляюсь:

netapp предложил переписать весь софт (с которым заявлена совместимость, кстати), и предложил купить ещё дисков, чтобы уменьшить задержку на запись с 232 секунд до… Пожалуйста, посчитайте, какая будет задержка при смене 10к на 15к диски, если при 10к RPM задержка была 3 минуты 52 секунды.

Допишите это в список моих претензий к саппорту.
Салазки там дурацкие, очень неудобно крепить в стойке с квадратными дырками.
Согласены, салазки не самые удобные. Мы на время тестирования поставили на смонтированные в стойке старые рельсы от FAS. Конечно, крепятся не в 2 клика (как в предыдущем посте у Dell VRTX) и не выдвигаются на метр из стойки, но это же не самое главное. Каждый день вынимать не придется.
Хотелось бы в отчете о тестировании увидеть результаты работы с крупными блоками (512К и 1024К). И сравнение производительности DDP и RAID6.
Статья интересная, конечно, но вот несколько вопросов появилось:
1. Как NetApp позиционирует эту серию (этот массив) на рынке? Чем он хорош, под какие задачи заточен? Области применения где он будет наиболее эффективен?
2. Каковы предельные показатели массива по производительности (IOps, throughput)? какую нагрузку он держит лучше всего?

Заранее спасибо!
Чем он хорош, под какие задачи заточен? Области применения где он будет наиболее эффективен?


full motion видео, медиа контент, обработка сейсмических данных, видеонаблюдение, высокопроизводительные вычислительные кластера (HPC), D2D бэкап, геологоразведка и др.
На самом деле линейка E-Series не однородна, как может показаться на первый взгляд.
NetApp позиционирует массивы E-series как application-driven arrays. Другими словами, E-series — это массив, который может отлично обрабатывать однотипную нагрузку, например последовательные чтение/запись большими блоками (512К, 1024К). Либо наоборот, случайные чтение/запись блоками небольшого размера (4к, 8к..). В отличии от FAS E-Series предоставляет дисковые ресурсы только как блочные устройства, поэтому эти массивы являются частью инфраструктуры (там где данными управляет приложение) и предназначены для решений, в которых потребитель хочет получить наилучшее соотношение показателей цена за гигабайт/производительность.
Несмотря на расхожее мнение (и даже на маркетинговую информацию с оффсайта NetApp :-)) массивы E-Series могут быть использованы не только для обработки потоковых данный и в решения HPC + BigData. Они хорошо работают с виртуальными инфраструктурами (VMWare vSphere, Hyper-V), базами данных (Oracle, MS SQL), а также realtime приложениями.

Массивы E-Series предоставляют потребителям широкие возможности выбора конфигураций:
  • дисковые полки трех разных размеров — 12-ти дисковые, 24-х дисковые и 60-ти дисковые;
  • поддерживаются диски разных форм-факторов, как 2.5 так и 3.5;


А также возможности для тонких настроек с учетом требований приложений:
  • размер cache block;
  • различные уровни RAID и различные размеры дисковых групп;
  • выбор размера блока (сегмента).


Дисковые массивы E-Series отличает простота конфигурирования и надежность (принцип «настроил и забыл» — это про них).

Позиционирование массивов E-Series с разбивкой моделей на группы:
  1. E2xxx — системы начального и среднего уровня. Могут одинаково хорошо использоваться как для приложений бекап-решений, так и для развертывания виртуальной инфраструктуры малого и среднего уровня (SMB), развертывания таких приложений как MS Exchange или баз данных, к которым не предъявляются повышенные требования по производительности.
  2. E5xxx — система среднего уровня, предназначенная для HPC и BigData сред (lustrefs, hadoop e.t.c), realtime видеосистем. Также достаточно хорошо может быть оптимизированна для баз данных больших объемов (например для заливки информации из CDR у операторов связи).
  3. EFxxx – высокопроизводительный Flash массив. Предназначен для приложений, к которым предъявляются высокие требования по времени отклика и производительности (IOps). Могут использоваться в realtime биржевых системах, системах финансового прогнозирования, для построения высокопроизводительных аналитических систем и баз данных.
Несмотря на расхожее мнение (и даже на маркетинговую информацию с оффсайта NetApp :-)) массивы E-Series могут быть использованы не только

Тут на самом деле штука же какая. Да, могут быть использованы. Но это как то, что по городу можно ездить на автомобиле и на мотоцикле. И выбирая автомобиль вас заинтересует наличие климат-контроля, варианты коробки передач, объем багажника, качество аудиосистемы, регулировки водтельского кресла…
А мотоцикл — он быстрый. И с ним вас не будет интересовать способ монтажа в салон детского кресла. :)

В общем — да, конечно, E-series можно использовать много для чего, даже если туда можно было бы использовать FAS. Ну как на мотоцикле тоже можно ехать по городу. И даже быстрее чем на машине. Если вы понимаете о чем я :)
Зарегистрируйтесь на Хабре , чтобы оставить комментарий