Особенности работы Auto Tiering в СХД Qsan XCubeSAN

    Продолжая рассматривать технологии ускорения операций ввода/вывода в применении к СХД, начатые в предыдущей статье, нельзя не остановиться на такой весьма популярной опции, как тиринг (Auto Tiering). Хотя идеология работы данной функции весьма близка у различных производителей систем хранения, мы рассмотрим особенности реализации тиринга на примере СХД Qsan.



    Несмотря на многообразие данных, хранимых на СХД, эти самые данные можно разделить на несколько групп, исходя из их востребованности (частоты использования). К наиболее популярным («горячим») данным крайне важно организовать максимально быстрый доступ, в то время как обработку менее востребованных («холодных») данных можно выполнять с более низким приоритетом.


    Для организации подобной схемы как раз и применяется функционал тиринга. Массив данных в таком случае состоит не из однотипных дисков, а из нескольких групп накопителей, образующих разные уровни (tier) хранения. При помощи специального алгоритма данные автоматически перемещаются между уровнями с целью обеспечения максимальной итоговой производительности.



    СХД Qsan поддерживают до трех уровней хранения:


    • Tier 1: SSD, максимальная производительность
    • Tier 2: HDD SAS 10K/15K, высокая производительность
    • Tier 3: HDD NL-SAS 7.2K, максимальная емкость


    Auto Tiering пул может содержать в себе как все три уровня, так и только два в любых сочетаниях. Внутри каждого Tier накопители объединяются в привычные RAID группы. Для максимальной гибкости уровень RAID в каждом Tier может быть разным. Т.е., например, ничто не мешает организовать структуру вида 4x SSD RAID10 + 6x HDD 10K RAID5 + 12 HDD 7.2K RAID6


    После создания томов (виртуальных дисков) на Auto Tiering пуле на нем начинается фоновый сбор статистики обо всех операциях ввода/вывода. Для этого пространство «нарезается» на блоки размером 1ГБ (так называемые sub LUN). При каждом обращении к такому блоку ему присваивается коэффициент 1. Затем, с течением времени, данный коэффициент уменьшается. Через 24 часа он, при отсутствии запросов ввода/вывода к данному блоку, уже будет равен 0.5 и продолжит свое падение через каждый последующий час.


    В определенный момент времени (по умолчанию каждый день в полночь) происходит ранжирование собранных результатов по активности sub LUN на основе их коэффициентов. Исходя из этого, принимается решение, какие блоки перемещать и в каком направлении. После чего, собственно, и происходит релокация данных между уровнями.



    В СХД Qsan отлично реализовано управление процессом тиринга при помощи множества параметров, что позволит весьма гибко настроить итоговую производительность массива.


    Для определения начального местоположения данных и приоритетного направления их перемещения используются политики, которые задаются отдельно для каждого тома:


    • Auto Tiering – политика по умолчанию, изначальное размещение и направление перемещений определяется автоматически, т.е. «горячие» данные стремятся на самый верхний уровень, а «холодные» данные съезжают вниз. Исходное размещение выбирается исходя из доступного места на каждом из уровней. Но нужно понимать, что система прежде всего стремится максимально использовать самые быстрые накопители. Поэтому при наличии свободного пространства данные будут размещаться на верхних уровнях. Эта политика подходит для большинства сценариев, когда нельзя заранее спрогнозировать востребованность данных.
    • Начать с высокого, а затем Auto Tiering – отличие от предыдущего только в изначальном расположении данных (на самом быстром уровне)
    • Максимально высокий уровень – данные всегда стремятся занять самый быстрый уровень. Если в процессе работы их смещают вниз, то при первой возможности они перемещаются обратно. Эта политика подходит для данных, к которым требуется максимально быстрый доступ.
    • Минимальный уровень – данные всегда стремятся занять самый низкий уровень. Эта политика отлично подойдет для редко используемых данных (например, архивы).
    • Без перемещения – система автоматически определяет изначальное местоположение данных и не производит их перемещение. Однако, статистика продолжает собираться на случай, если впоследствии потребуется их релокация.

    Стоит отметить, что несмотря на то, что политики определяются при создании каждого тома, их можно неоднократно менять «на лету» в процессе жизненного цикла системы.


    Помимо политик для механизма тиринга также настраивается частота и темп перемещения данных между уровнями. Можно задать конкретное время перемещения: ежедневно или в определенные дни недели, а также сократить интервал сбора статистики до нескольких часов (минимальная частота – 2 часа). Если имеется необходимость ограничить время выполнения операции по перемещению данных, можно задать временные рамки (окно для перемещения). Помимо этого, также указывается скорость релокации – 3 режима: быстрый, средний, медленный.



    В случае возникновения потребности в немедленной релокации данных имеется возможность выполнить ее в ручном режиме в любое время по команде администратора.


    Понятно, что чем чаще и быстрее будет производиться перемещение данных между уровнями, тем гибче СХД будет подстраиваться под текущие условия эксплуатации. Но вместе с тем стоит и помнить, что перемещение – это дополнительная нагрузка (прежде всего на диски), поэтому совсем уж без крайней необходимости «гонять» данные не стоит. Лучше запланировать перемещение на моменты минимальных нагрузок. Если же работа СХД постоянно требует высокой производительности в режиме 24/7, то стоит снизить темп релокации до минимума.


    Обилие настроек тиринга без сомнения обрадует продвинутых пользователей. Однако и для тех, кто сталкивается с подобной технологией впервые, нет ничего страшного. Вполне можно довериться настройкам по умолчанию (политика Auto Tiering, перемещение на максимальной скорости раз в сутки ночью) и по мере накопления статистики корректировать те или иные параметры для достижения требуемого результата.


    Сравнивая тиринг с такой не менее популярной технологией увеличения производительности, как SSD кэширование, следует помнить о разных принципах работы их алгоритмов.


    SSD кэширование Auto Tiering
    Скорость наступления эффекта Почти мгновенно. Но заметный эффект только после «прогрева» кэша (минуты-часы) После сбора статистики (от 2-х часов, в идеале – сутки) плюс время на перемещение данных
    Длительность эффекта Пока данные не будут вытеснены новой порцией (минуты-часы) Пока востребованность данных актуальна (сутки и более)
    Показания к применению Мгновенное увеличение производительности на короткий срок (базы данных, среды виртуализации) Увеличение производительности на длительный период (файловые, web, почтовые сервера)

    Также одной из особенностей тиринга является возможность его использования не только для сценариев вида «SSD + HDD», но и «быстрые HDD + медленные HDD» или вообще все три уровня, что в случае применения SSD кэширования в принципе невозможно.


    Тестирование


    Для проверки работы алгоритмов тиринга мы провели простейший тест. Был создан пул из двух уровней SSD (RAID 1) + HDD 7.2K (RAID1), на котором разместили том с политикой «минимального уровня». Т.е. данные всегда должны располагаться на медленных дисках.




    Интерфейс управления наглядно показывает размещение данных между уровнями


    После заполнения тома данными, мы сменили политику размещения на Auto Tiering и запустили тест IOmeter.



    После нескольких часов теста, когда система смогла накопить статистику, начался процесс релокации.



    По окончании перемещения данных наш тестовый том полностью «переполз» на верхний уровень (SSD).




    Вердикт


    Auto Tiering – замечательная технология, позволяющая с минимальными материальными и временными затратами повысить производительность системы хранения за счет более интенсивного использования скоростных накопителей. Применительно к Qsan единственное вложение – это лицензия, которая приобретается раз и навсегда без ограничения на объем/число дисков/полок/пр. Данный функционал снабжен настолько богатыми настройками, что способен удовлетворить практически любые задачи бизнеса. А визуализация процессов в интерфейсе позволит эффективно управлять устройством.
    Skilline
    23,10
    Компания
    Поделиться публикацией

    Комментарии 0

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое