P41X использовать для нексенты имхо совсем не стоит. Лучше уж купить нормальный LSI HBA, а 41X продать страждущим.
Как кстати raid-z1 в продакшене? Не страшно за пул? Как собирали vdev'ы по сколько физ. устройств? В любых raid производительность vdev на запись будет равна производительности 1 (одного) диска, поэтому интересно посмотреть как сильно вы делили ваши 40 устройств на vdev'ы.
Как быстро переключается HA кластер на резервную ноду? Меняли ли таймауты в гипервизоре?
Какая конфигурация нод? Какой плагин используете (simple или полноценный)?
Используете 3.1.3.5 или уже обновились на 3.1.4?
Совместимость comstar таргета и инициатора в новых серверных виндах это только один пункт из ваших «шокирующих деталей». Причем пока кроме как у вас нигде больше я не встречал. Нормально работает даже с MPIO.
Деградация производительности CoW файловых систем при полной заполненности это нормально by design. Поэтому в том же NetApp мануале и во всех admin guides по ZFS написано о необходимости оставлять 30% свободного места. Прочтите хотя бы официальный админ гайд по ZFS от сана/оракла или серию статей на сайте нексенты.
Про апгрейд с ребутом вообще непонятно, вы ожидали чего-то иного при обновлении software-defined стораджа?
У нексенты масса нерешенных проблем, что-то вроде iSCSI hangs on heavy IO load, удаление дедуплицируемого тома и прочие. Часть из них пофиксили в 3.1.4, часть в 4й ветке. Но вы не описали ни один их них. Все эти «шокирующие детали» результат плохого знания мат.части и недостаточно глубокого анализа выбранного продукта.
P.S. Да и intel 710 не самый прям распрекрасный вариант. Это лучший из дешевого.
Сам использую nexenta как быстрый и дешевый сторадж для некритичных и тестовых данных на шасси HP DL180G6 с 25 SAS 300GB 10k rpm и 64GB RAM на кластере из 5 хостов ESXi. В продакшене связка из 2х Dell EqualLogic PS4110XV с синхронной репликацией.
Ламера. Все это описано в документации и на форумах. Читать надо внимательно и продумывать сайзинг перед внедрением. С таким подходом с любым решением проблемы будут.
Что значит не аналог? Решения от Cisco начинаются от 20 килобаксов и лицензией на количество точек от 50 ;) По крайней мере так было, когда мы разворачивали сеть на длинках.
А я разворачивал сеть с бесшовным роумингом на D-Link DWS-3024 в качестве контроллера и двух десятков DWL-8500/3500AP в качестве коммутируемых точек доступа (3200/8200AP выглядят совершенно так же, но не являются коммутируемыми к dws-3024/3026). Ничего так железки, свитч умеет PoE, находит точки как по ip так и по своему какому-то протоколу на канальном уровне, умеет дуал-бут, перекидывает точки в разные каналы в зависимости от помех. Вобщем используется уже 2 года, в принципе без проблем. Вначале конечно пришлось повозиться и сменить штук 5 прошивок как на свитч так и на точки, но это с длинками всегда так.
Как кстати raid-z1 в продакшене? Не страшно за пул? Как собирали vdev'ы по сколько физ. устройств? В любых raid производительность vdev на запись будет равна производительности 1 (одного) диска, поэтому интересно посмотреть как сильно вы делили ваши 40 устройств на vdev'ы.
Какая конфигурация нод? Какой плагин используете (simple или полноценный)?
Используете 3.1.3.5 или уже обновились на 3.1.4?
Про дедупликацию в user guide написано в каждом разделе: «Use this parameter with caution, because it utilizes RAM resources intensively.» Насколько intensively написано в интернетах чуть ли не на каждом углу. Например, в блоге у Гонзалеса:
constantin.glez.de/blog/2010/03/opensolaris-zfs-deduplication-everything-you-need-know
constantin.glez.de/blog/2011/07/zfs-dedupe-or-not-dedupe
Поэтому не составляет никакого труда просчитать размер ARC и/или L2ARC для дедуплицированного тома.
Деградация производительности CoW файловых систем при полной заполненности это нормально by design. Поэтому в том же NetApp мануале и во всех admin guides по ZFS написано о необходимости оставлять 30% свободного места. Прочтите хотя бы официальный админ гайд по ZFS от сана/оракла или серию статей на сайте нексенты.
Про апгрейд с ребутом вообще непонятно, вы ожидали чего-то иного при обновлении software-defined стораджа?
У нексенты масса нерешенных проблем, что-то вроде iSCSI hangs on heavy IO load, удаление дедуплицируемого тома и прочие. Часть из них пофиксили в 3.1.4, часть в 4й ветке. Но вы не описали ни один их них. Все эти «шокирующие детали» результат плохого знания мат.части и недостаточно глубокого анализа выбранного продукта.
P.S. Да и intel 710 не самый прям распрекрасный вариант. Это лучший из дешевого.
Сам использую nexenta как быстрый и дешевый сторадж для некритичных и тестовых данных на шасси HP DL180G6 с 25 SAS 300GB 10k rpm и 64GB RAM на кластере из 5 хостов ESXi. В продакшене связка из 2х Dell EqualLogic PS4110XV с синхронной репликацией.
www.youtube.com/watch?v=a4-G7kKAx0I
P.S. Для не профессионалов или профанов существует FreePBX :)