Комментарии / Профиль Viacheslav

Вячеслав В@Viacheslav_V

AERODISK

Подписчики

ПрофильСтатьи22ПостыНовостиКомментарии122

Автоматизированная настройка СХД АЭРОДИСК с помощью REST API

Viacheslav_V 26 мар 2024 в 07:14

А о каком функционале речь?

«Аэродиск» заменил Jira на SimpleOne

Viacheslav_V 12 янв 2024 в 16:54

Ну мы в своей телеге (ИЗЧ) уже писали об этом)))

А на Хабре у нас чуть-чуть другой формат постов, мы обычно пишем тут над- и подкапотку про свои продукты. За редким исключением конечно.

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 3 мар 2023 в 11:25

Здравствуйте, благодарю за хорошую оценку (приятно) и за повод для дискуссии :-).

RDG ("интеллект, функциональность, большие объемы") - прямо на старте вынуждает выбирать уровень RAID для всего пула. Как так? Это "интеллект и функциональность"?

Интеллект и функциональность в RDG - это когда вы можете:

создавать большие двухслойные пулы с большим количеством дисков;
из коробки реализовать файловый и блочный доступ с одного пула
делать много разных вариантов снапшотов: стандартные ROW снэпшоты, снэпклоны, связанные клоны, группы консистентности, локальные реплики
создавать не только классические Рэйды 1/10/5/50/6/60, но и рэйд с тройной четностью
использовать глобальную автозамену дисков для любых типов пулов
ускорять производительность разными вариантами кэшей
назначать политики перестроения для разных типов данных в зависимости от задачи
экономить место за счет компрессии и дедупликации для больших архивов
ну и делать прочие полезные телодвижения с тонкими томами, VLAN-ами репликацией и метрокластером.
ну а если после всего вышеперечисленного по прежнему вас будет волновать, что вас "вынуждают выбирать уровень RAID для всего пула", то во-первых, никто не мешает создать несколько пулов, а во-вторых не только мы, но и также не менее прекрасные ребята из NetApp-а с вами категорически не согласятся и скажут, что это благо! :-)

DDP - здесь уровень RAID можно выбирать для тома, размещаемого в пуле. Но вот только диски для чанков этого тома, физические диски, нужно выбирать из пула вручную. И следить за тем, чтобы пространство на физических дисках в пуле при множестве RAID-групп (т.е. томов) распределялось равномерно. Особенно интересно это всё начинает выглядеть при количестве дисков в пуле большим 10, т.к. нужно теперь учитывать, что у тома с RAID-5 (например) физических дисков должно быть меньше 11, иначе производительность падает. Очень похоже на тетрис, только не так весело.

Про чанки вручную вы ошибаетесь, возможно перепутали что-то. Чанки у нас в DDP распределяются автоматически и равномерно. Для этого при создании пула надо выбрать количество дисков для него, дальше система сама все распределит в зависимости от свободного места. Специально следить за этим не надо. Возможно когда-было не так, но я если честно не помню такого, если напомните, буду признателен.
А ещё Куриман подсказывает, что набивать в DDP-тома много дисков не рекомендуется, о чем мы везде пишем и говорим, для этого есть RDG, там это разумно.

В обоих случаях это такой дремучий олдскул, что смотреть страшно

тогда отвернитесь, но помните, что в таком положении дремучий олдскул будет смотреть на вас, находясь у вас за спиной :-)

И в обоих случаях отсутствуют такие ставшие уже привычными вещи как распределенные spare диски и быстрое восстановление после сбоя

опять вы что-то перепутали. Hotspare диски у нас глобальные-универсальные. Т.е. один диск может подменить своего сбойного собрата в любом типе пула.
не очень понял, что вы имеете в виду под "быстрое восстановлением после сбоя"
если вы говорите о перестроении при выходе из строя диска , то тут у нас также два вполне годных инструмента для его ускорения: 1)частичное восстановление (только поврежденные данные) 2)политика перестроения. Разве этого мало?
если вы говорите о восстановлении после сбоя той или иной части СХД (ноды, порта, БП итп), то на аппаратном уровне все задублировано, а на программном работает целая связка кластерных служб и переключение выполняется за секунды и без прерывания доступа. На крайнем вебинаре мы подробно рассказали об этом, а также продемонстрировали выход из строя портов и дисков в прямом эфире. Вот запись пожалуйста

Не стоит забывать, что производительность с включенным дополнительным функционалом (дедупликация, компрессия) падает кратно.

Тут полностью с вами согласен, есть такая у нас боль. Именно поэтому мы везде рекомендуем эти функции не использовать для задач с высокой производительностью. Но это не значит, что мы не будем развивать это направление. Еще как будем.

А что внутри Аэродиска делает ZFS? Кто кого взял в заложники?

прочитав это замечание, другие опенсорс компоненты СХД Аэродиск обиделись и загрустили. Почему? Потому-что про них опять забыли, а они не менее важны! :-). Давайте не будем их обижать и вспомним их тоже: linux, net-tools, udev, smartctl, zfs, lvm, drbd, smb, chrony, ipmitool, prometheus, iperf, scst, iscsi_driver, fc_driver, multipath, snmp, snmptrap, python, javascript, flask, react, sqlite, postgresql, redis, gunicorn, nginx
а если серьезно, то мы всегда говорили, что опенсорса внутри у нас много и подробно рассказывали какого. Не вижу в этом ничего плохого. Наоборот, в прямых хороших руках, которые растут из плеч, и в которых есть хорошим напильник, опенсорсные поделки превращаются в инструменты уровня предприятия, а сообщество получает профит в виде новых разработок.
Более того, мы настолько любим тему опенсорса, что скоро один из наших продуктов реализуем в опенсорс версии со своим репозиторием, сообществом, блэкджеком и хохломой. Не переключайтесь!

Российские конкуренты (все) уступают нам в функциональности.
А вот это чистая правда

Ещё раз благодарю за теплые слова :-), для нас это ценно!

Спасибо, буду рад дискуссии.

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 27 фев 2023 в 15:09

Нет ничего лучше бесплатного хорошего софта. Пользуйтесь на здоровье!

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 27 фев 2023 в 15:09

Спасибо за много интересных вопросов :-) Отвечаю

вы наверняка интересовались и в курсе жизни конкурентов, западных и Российских, есть ли у вас киллер-фичи технического плана, может, какие-то опции которых нет ни у кого или характеристики, по которым вы готовы обогнать ведущих зарубежных производителей ?

Интересовались, интересуемся и будем интересоваться!

По сравнению нашего и "ихнего" кунг-фу, не хочу тут устраивать прямой холивар, т.к. это неэтично, поэтому отвечу в общем виде.

Российские конкуренты (все) уступают нам в функциональности.

Зарубежные превосходят (логично), но есть у нас прекрасная особенность, которой у них нет. Это две принципиально разные схемы организации хранилищ в одной СХД - RDG (Raid Distributed Group) и DDP (Dinamic Disk Pool). Большинство СХД сильных зарубежных конкурентов - заложники своей схемы организации хранения. К примеру, есть массив с кучей функций и интеллектуальных фич, поддержкой больших объемов и много-много всего, но за интеллект приходится платить невысокой производительностью. Или наоборот, производительность - пушка, но функциональность слабая. Поэтому мы чтобы избавить заказчика от мук выбора "красивый или умный (тупой или страшный)", используем две схемы организации хранения RDG - интеллект, функциональность, большие объемы, DDP - производительность. Это то что выгодно нас отличает от известных нам сильных зарубежных конкурентов.

Насколько активна сейчас ветка Восток ? Расскажите что у него под капотом, много ли проблем ?

СХД Восток активно развивается и продается. Что под капотом писали в одной из предыдущих статей: https://habr.com/ru/company/aerodisk/blog/656757/

Лично мы пытались поднять простенькое СХД на 8СВ (mdadm + tgt), но упёрлись в то что не удаётся достичь производительности между двумя контроллерами (HBA и LAN) более чем 4ГБит, на 8С ситуация ещё хуже. Говорят, это решается тонким тюнингом ядра. Удалось ли вам с этим справиться ?

Проблем с разработкой на Эльбрусе хватает, но они решаемы любым взрослым коллективом разработчиков. И да, вы правы, решать их надо доработкой ядра, которой мы активно занимаемся не без поддержки коллег их АльтЛинукса (отдельное спасибо Михаилу Шигорину).

Есть ли вообще сравнительные тесты производительности Engine и Восток со схожими параметрами ?

Есть см. статья https://habr.com/ru/company/aerodisk/blog/520888/

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 27 фев 2023 в 14:51

Здравствуйте, очень правильные вопросы.

Но не отказ контроллера. Как насчет контроллер дернуть? :)

Отказ контроллера демонстрировали в одной из предыдущих статей, см ссылка https://habr.com/ru/company/aerodisk/blog/447070/ с того времени логика работы кластера не изменилась.

Почему на random r/w не восстанавливается время отклика после возврата оптимального пути?

Это баг версии 5.0.0 (на ней тесты делали), исправлено в версии 5.0.1 (вышла на днях)

Почему на seq write производительность неоптимального пути выше?

В случае такой нагрузки активнее начинает работать процессор (это видно на схеме) именно за счет этого вытягивается производительность. Это, само собой, актуально когда есть свободные процессорные ресурсы, если бы процессор был бы нагружен на 80%+ была бы просадка

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 13 фев 2023 в 08:11

А по поводу цены на СХД, ранее отвечали на этот вопрос в нашем ТГ канале, предлагаю вам ознакомиться

https://t.me/aerodisk_official/96

Отказоустойчивость СХД АЭРОДИСК в условиях высокой нагрузки

Viacheslav_V 13 фев 2023 в 08:06

Здравствуйте, к счастью вы ошибаетесь.

По железу, если очень грубо, то так

1)корпуса, материнки, бэкплейн, плюс часть элементов питания российские

2)процессоры в зависимости от модели, Восток - российские, Engine - зарубежные

3)диски и адаптеры, а также ряд элементов питания зарубежные

Подробности можно почитать тут

https://habr.com/ru/company/aerodisk/blog/504306/

По софту. Функционал A-Core значительно шире чем просто программный рэйд, можете посмотреть подробнее тут

https://aerodisk.ru/wp-content/uploads/2022/07/Tehnicheskoe_opisanie_-AERODISK-VOSTOK-5_ENGINE-5.pdf

Чего тебе надобно, старче? Составляем дорожную карту развития СХД

Viacheslav_V 10 ноя 2022 в 09:17

Да, хорошая идея, спасибо. Сделаем в течение пары часов.

Как из просто хорошей разработки сделать безопасную?

Viacheslav_V 18 окт 2022 в 07:21

Про NT сказать ничего не могу. Не читал, не осуждаю. Могу сказать только, что указанные в статье решения показали себя хорошо.

Резервное копирование системы виртуализации АЭРОДИСК АИСТ с помощью RuBackup

Viacheslav_V 2 июн 2022 в 10:04

На сайте разработчика

https://rubackup.ru/index.php/try

Резервное копирование системы виртуализации АЭРОДИСК АИСТ с помощью RuBackup

Viacheslav_V 25 мая 2022 в 07:22

Здравствуйте, ну не будем же мы писать, "что в отличие от Акрониса....))))"

Резервное копирование системы виртуализации АЭРОДИСК АИСТ с помощью RuBackup

Viacheslav_V 25 мая 2022 в 07:19

Здравствуйте

Дедупликация работает в онлайне.

Восстановление ВМ происходит в другую ВМ. Если при возникновении ВМ уже существует, то она восстановливается рядом с другим именем (префикс добавляется)

Техподдержка АЭРОДИСК: как построить хорошо работающую систему и не сойти с ума?

Viacheslav_V 26 апр 2022 в 09:32

Здравствуйте. Очень правильный вопрос, почему-то забыл об этом написать в статье. Рассказываю о принципах масштабирования по линиям.

Первая линия. Технический колл-центр, масштабируется также как и другие колл-центры, путем набора и быстрого обучения людей на местах, либо расширением услуг внешнего колл-центра (также с обучением сотрудников) и оплатой по объему обращений.

Вторая линия. Исходя из нашей практики, на 100 "условных СХД" на поддержке требуется один инженер второй линии (с нашим расширенным функционалом). Набор и обучение - процесс сложный, но оно того стоит. Также у инженера второй линии есть ресурс в виде внешних удаленных рук (как правило это несколько специально обученных подрядчиков с высокими компетенциями). Этот ресурс инженер привлекает сам когда требуется (у него есть специальный бюджет для этого). В случае необходимости этот ресурс наращивается с оплатой по запросам.

Третья линия. Разработка. Тут похожая математика, как и с инженерами. Только "200 условных СХД" = 1 разработчик на поддержке.

С виртуализацией математика отличается, но принцип тот же.

Как скрестить Intel с Эльбрусом: Обзор новой линейки СХД АЭРОДИСК

Viacheslav_V 27 мар 2022 в 08:49

1. Эльбрусы сейчас в России в достаточном для наших задач (СХД) количестве.

2. Новые будут делаться на других заводах (детали, пожалуйста, не к нам, а к производителю).

3. Корпуса, материнские платы, бэкплейны итп давно уже в России делаются (во всяком случае для наших систем)

4. Другие комплектующие (втч процессоры ) мы уже давно завозим по своим специальным каналам

Резюмирую. Производство СХД у нас налажено давно, тк мы в наших прогнозах рассматривали в том числе и подобный поворот событий, то есть были к этому готовы. Поэтому и сейчас, и через несколько лет мы готовы производить и поддерживать наши системы хранения (и не наши кстати тоже если очень попросят))

Как скрестить Intel с Эльбрусом: Обзор новой линейки СХД АЭРОДИСК

Viacheslav_V 23 мар 2022 в 11:34

Ясно, спасибо.

Мы в предыдущей статье писали про поддержку, в этой решили не баянить :-)

Думаю в следующих будем просто краткую справку про поддержку, документацию и пр. давать в конце статьи.

Как скрестить Intel с Эльбрусом: Обзор новой линейки СХД АЭРОДИСК

Viacheslav_V 23 мар 2022 в 11:32