Комментарии / Профиль raidixteam / Хабр

Как стать автором

Пользователь

Профиль Публикации 30Комментарии 95Закладки 2

СХД для HPC-инфраструктуры, или Как мы собрали 65 ПБ хранения в японском исследовательском центре RIKEN

raidixteam 27 ноя 2018 в 17:49

Основные тесты проводились по следующим параметрам:
iozone -i0 -i1 -I -+n -r 16m -s 100g -t N -+m hostlist-xfsN

Большая часть тестов — на стороне партнера, и мы не все детали можем разглашать.

0

Посмотреть

Конференция ПРОSTOR 2018: вопросы и ответы про будущее СХД

raidixteam 15 ноя 2018 в 12:47

Yadro можно назвать нашим конкурентом, но у нас с ними немного разные подходы к созданию продукта.

0

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 24 авг 2018 в 16:23

— вы меняли именно recordsize? Он к ZVOL никак не относится, аналогичный для ZVOL параметр — volblocksize. Его надо обязательно менять соответственно нагрузке, от 4k до 1M. На 1M мерять 4k нагрузку для ZFS — убийство.

Меняли recordsize. volblocksize = 8K во всех тестах. Меняли на меньший (4k) — влияние минимальное.

— вы пул заполняли полностью? ZFS пулы нельзя заполнять полностью, особенность любой CoW ФС с переменным размером блока.

Нет, пул заполнен не полностью:
tank :: USED 2.24T :: AVAIL 4.17T
tank/raid :: USED 2.24T :: AVAIL 4.17T

— какое количество потоков? На 1 потоке RAIDZ выдаст вам IOPS 1 диска, но при росте потоков ZFS прекрасно агрегирует запись.

64 потока с глубиной 32 при iops тестах

Если ваш тест корректен, то получается все юзеры ZFS в мире (включая HPC на lustre) получают не более 700Мбайт на запись? Уверяю, что ZFS спокойно даёт больше.

Lustre, все же, не zvol пользует. Когда тестируешь на уровне ФС (iozone) результаты лучше. На нашем полигоне с RAIDZ2 около 3GBps на запись и 4GBPs на чтение. Страйпинг сильно лучше.

+1

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 24 авг 2018 в 16:18

Теоретически он может работать с HDD, но мы не тестировали, поэтому, не можем рекомендовать. Можете скачать бесплатную версию и попробовать :)

0

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 22 авг 2018 в 14:43

Нагрузка на железо замерялась. Подробную аналитику по этому вопросу мы изложим в отдельном материале.
Ваше подозрение вполне справедливо. Нагрузка, на самом деле, больше, чем у этих решений. Это объясняется тем, что параллелизация вычислений в большем объеме использует ресурсы CPU, задействуя все ядра равномерно. Правда, стоит отметить, что эта нагрузка не критична и оставляет место для полноценной работы других приложений.

+2

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 22 авг 2018 в 14:24

Вот именно, куча сложностей. А так сами написали, сами раздаем бесплатные лицензии. Никто не мешает.

+1

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 22 авг 2018 в 14:20

Наша оценка показала, что слишком много придется вносить изменений, работая с чужим кодом. Свой продукт оказалось писать проще и эффективнее, тк мы ничем не ограничены с точки зрения архитектурных ноу-хау. Тем более, mdraid пытались разогнать и Intel и SGI, к сожалению, удалось лишь точечно. Intel, в итоге, сделал VROC.

+2

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 22 авг 2018 в 14:19

Как раз, наоборот, мы потратили много времени на попытку разогнать zfs, тем более у нас есть партнеры, которые хотели бы создавать пулы из наших устройств. Не вышло…
Полигон стоит собранный, если у вас есть идеи как получить лучшие результаты, мы готовы ими воспользоваться, а полученные цифры добавим в статью.

+2

Посмотреть

Тестирование программных RAID-массивов для NVMe-устройств по методике SNIA

raidixteam 22 авг 2018 в 14:19

Мы пробовали использовать разные (4, 16, стандартный (128), 1024). Производительность практически не менялась. 1M нам советовали специалисты по ZFS с рынка HPC (Там файловая система используется как backend для Lustre). На нем и остановились.

Мы запустили сокращенный набор тестов с recordsize=8k. В ближайшее время добавим результаты.

+1

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 4 июл 2018 в 14:36

Для iSER RoCE поддерживается уже в текущей сборке, для NVMeOF — пока нет, дорабатываем.

0

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:45

Все так. Уже выбираем цвет для корпоративной яхты :)

+3

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:41

1. Тестирование детально не описывали здесь, поскольку тестирование распределенно кластера это большая и сложная тема, которую можно долго обсуждать ввиду большого количества параметров и правильной интерпретации результатов. Лучше все подробно расписать в отдельной статье. Над табличкой добавили информацию про параметры нагрузки.
2. Для двух дисков этой модели при наличие сетевого RAID — локальный страйп подойдет.
В случае отказа 1 диска будет работать сетевой RAID. За два года использования нашего кластера (32 накопителя) не было ни одного отказа.
Также в наших нодах стоят по 16 HDD. Для них мы используем локальный RAID6. Для трех NVMe рекомендуем локальную 5-ку. Перед выбором схем защиты мы строили модель отказов системы, выдерживая уровень доступности 99.999.

0

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:37

Вы, наверно, и нанотехнологии не любите?

+1

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:36

Поддерживается NVMe over Infiniband. В принципе, с небольшой доработкой можно добавить поддержку FC и RoCE.

0

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:36

Не все радужно. Но основные задачи касаются, скорее, расширенного функционала, а не параметров стабильной работы.
За пожелания — отдельное спасибо :)

0

Посмотреть

Российская распределенная СХД. Как все устроено

raidixteam 3 июл 2018 в 11:32

Спасибо! Мы действительно старались описать возможности (и потенциал) продукта, выходя за пределы отечественного железа.

0

Посмотреть

Наращиваем дисковую массу без стероидов. Обзор 102-дисковой полки Western Digital Ultrastar Data102 и конфигурации СХД

raidixteam 13 июн 2018 в 12:06

У нас графиков, к сожалению, нет. Сделали запрос партнерам.

0

Посмотреть

Наращиваем дисковую массу без стероидов. Обзор 102-дисковой полки Western Digital Ultrastar Data102 и конфигурации СХД

raidixteam 27 апр 2018 в 13:02

1. Возникла опечатка. Правильно будет: «NVDIMM-N от Micron».
2. Попозже добавим сюда спецификацию с NVDIMM-N.

0

Посмотреть

Наращиваем дисковую массу без стероидов. Обзор 102-дисковой полки Western Digital Ultrastar Data102 и конфигурации СХД

raidixteam 27 апр 2018 в 12:59

RAIDIX поддерживает любые диски любых производителей.
JBOD от WD продается только с минимальным набором дисков и официально расширяется только дисками этого же производителя.

0

Посмотреть

Энергонезависимая память NVDIMM для защиты кэша в RAIDIX 4.6

raidixteam 7 мар 2018 в 10:13

Тему кэширования мы затрагивали в статье: "Работа с Незнайкой — технологии упреждающего чтения и гибридные СХД". Скоро напишем материал про заполнение SSD-кэша на основе машинного обучения. Других статей на эту тему на горизонте пока нет, но теперь будем иметь ввиду.

0

Посмотреть

2