Виртуальные рабочие столы (VDI), казалось бы, обладают огромным преимуществом перед обычными персональными компьютерами сотрудников. Однако в реальности требуется весьма производительное и к тому же дорогое «железо», чтобы виртуальная среда работала с адекватной скоростью и VDI не были раздражителем в трудовой деятельности персонала. Одним из бутылочных горлышек в инфраструктуре VDI является система хранения данных: от ее производительности напрямую зависит, стоит ли связываться с данной технологией или нет.
Зачем компании нужен VDI?
Технология VDI позволяет значительно упростить и автоматизировать управление IT инфраструктурой рабочих мест сотрудников организации. Отличие от традиционных рабочих станций и ноутбуков особенно заметно при большом штате персонала. В добавок, VDI – это отличный инструмент безопасной доставки рабочих инструментов сотрудника (так называемый desktop-as-a-service) из любой локации, что крайне востребовано в организациях с высокими требованиями к безопасности и/или имеющие разветвленную филиальную сеть (медицина, банки, образование, retail и пр.).
Если инфраструктура VDI грамотно развернута, то весьма скоро она начнет экономить денежные средства компании за счет кардинального снижения стоимости обслуживания и сокращения точек уязвимости из-за консолидации IT оборудования и ПО. При этом возрастет гибкость при добавлении новых рабочих мест, где бы они не находились.
Проблемы при развертывании VDI
Поскольку VDI подразумевает под собой множество пользователей, которые одновременно выполняют свои операции на рабочем месте, от IT инфраструктуры требуются не только высокие показатели производительности ввода/вывода, но и сверхнизкие задержки. Если где-то происходит «торможение», с высокой вероятностью это вызовет негатив у пользователей, и они будут требовать возврата к традиционным рабочим станциям. А это означает полный провал внедрения VDI.
По отчетам IDC самые провальные внедрения VDI были связаны с производительностью систем хранения, которые не смогли обеспечить высокоскоростной ввод/вывод для всей инфраструктуры. Так что выбор СХД c необходимой производительностью – это едва ли не самая главная задача при проектировании VDI. И, надо заметить, одна из самых затратных в плане стоимости.
Шпиндельные и гибридные (механические диски + флэш) СХД, как показала практика, не подходят для масштабных VDI проектов, поскольку построены на принципе кэширования запросов ввода/вывода с целью снижения задержек. Но размер кэша не бесконечен. Как только он заполнится, задержки возрастут, пользователи «взбунтуются» и, считай, проект загнется. Фактически требования по задержкам со стороны VDI настолько высоки, что даже традиционные RAID-based All Flash системы с NVMe или NVRAM кэшированием способны не справиться с нагрузкой.
В подобных проектах как нельзя кстати будут All Flash системы AccelStor, которые не имеют кэша: все данные пишутся на SSD сразу после некоторой перегруппировки, выполняемой «на лету» (синхронная запись). Отсутствие кэша означает постоянство в производительности как в плане IOPS и пропускной способности, так и плане задержек, которые, надо заметить, и так имеют весьма впечатляющие показатели.
Флэш оптимизированная архитектура
Технология RAID была разработана в конце 80-х годов прошлого века исключительно для использования традиционных шпиндельных дисков. И на сегодняшний день она является едва ли не самой широко и успешно используемой технологией в сфере хранения данных. Но при построении All Flash систем с использованием RAID имеются как минимум две проблемы:
- Данные пишутся на SSD в случайное расположение на накопителе
- Данные часто перезаписываются
All Flash системы AccelStor работают абсолютно по-другому, поскольку специально разработаны для эффективного использования твердотельных накопителей. Основой является фирменная технология FlexiRemap, не использующая кэш и RAID. 10 лет исследований и более 45 патентов позволяют раскрыть весь потенциал флэш памяти. Благодаря поддержке такого IT гиганта, как Toshiba Memory и наградам типа best-in-show на Flash Memory Summit 2016, технология FlexiRemap является по-настоящему революционной.
Почему FlexiRemap®?
Технология FlexiRemap® получила свое название как раз за перераспределение (remap) блоков данных перед записью на SSD. Данные перегруппируются в последовательные цепочки и пишутся на накопители кратно 4КБ, т.е. в режиме, наиболее комфортном SSD. Благодаря такому подходу можно достичь достаточно высоких показателей производительности (до 700K IOPS для random write, до 1.1M IOPS для random read+write) без использования кэша.
Большинство RAID-based систем хранения используют дорогие SAS SSD, которые необходимы для работы с двумя контроллерами, и, при этом, утилизируют их производительность только на 10%. FlexiRemap® в сочетании с кластерной архитектурой shared nothing использует более дешевые SATA SSD и утилизирует их производительность на 90%, что в итоге означает более низкую стоимость владения (TCO) и более быстрый возврат инвестиций (ROI).
В дополнение отметим, что SSD имеют предсказуемый цикл старения, связанный с количеством записанной на них информации. И в противовес RAID системам, которые имеют огромный overhead на операциях записи, технология FlexiRemap® записывает данные только однократно, тем самым увеличивая срок службы накопителей и снижая тот же показатель TCO.
Так что All Flash системы AccelStor с технологией FlexiRemap® отлично подойдут для проектов, использующих интенсивный ввод/вывод и требующих сверхнизких задержек. Таких, как VDI.
Скорейший возврат инвестиций для системы хранения
AccelStor предоставляет безлицензионную модель для своих устройств. Т.е. заказчик получает доступ ко всем технологиям (клоны, снапшоты, репликация, дедупликация и пр.) сразу и навсегда. Более того, техническая поддержка на устройства (и конечно же софт) распространяется на весь срок использования массива, а не только в рамках гарантии/расширения гарантии. Так что и здесь показатель TCO удается значительно снизить.
Использование алгоритма дедупликации (FlexiDedupe) позволяет сократить занимаемое данными пространство хранения. В применение к VDI отметим, что для linked clone итоговый коэффициент сжатия может легко достигать 10:1. В итоге полностью заполненный массив в сочетании с дедупликацией и thin provisioning может обеспечить стоимость одного активного рабочего места в районе 30 USD.
Тестирование
All Flash системы AccelStor NeoSapphireTM были протестированы при помощи пакета Login VSI, который является отличным инструментом для измерения производительности и масштабируемости VDI инфраструктуры.
В тесте использовалось 500 рабочих столов в режиме linked clone в среде VMware Horizon View. Все они располагалось на массиве NeoSapphire P710 (24x SSD, 10G iSCSI, single node, 700K IOPS sustained write) на 5 томах размером в 2ТБ каждый, плюс отдельный том для реплик. В качестве нагрузки выступала 8-ми нодовая платформа высокой плотности от Supermicro. Пара отдельных серверов и All Flash (тоже от AccelStor) массив вместили на себе инфраструктуру VDI и системы мониторинга теста.
Инфраструктура тестового оборудования
Организация виртуальных рабочих столов
В качестве рабочих столов выступали виртуальные машины на базе Windows 10 Pro (build 1709) с конфигурацией: 2x vCPU, 3.5GB RAM (100% reserved), 60GB HDD. Было сделано два профиля нагрузки. В терминах Login VSI они обозначены как knowledge и power. Отличия заключаются в степени влияния на вычислительные ресурсы и требования к вводу/выводу.
Worker | Knowledge | Power |
---|---|---|
Описание | Хорошо сбалансированная стрессовая нагрузка с высоким потреблением ресурсов CPU, RAM и IO | Очень интенсивная нагрузка с максимальным стрессом для системы, требующая очень больших ресурсов CPU, RAM и IO |
Используемое ПО | Adobe Reader Freemind/Java Internet Explorer MS Excel MS Outlook MS PowerPoint MS Word Photo Viewer 7-ZIP |
Adobe Reader Freemind/Java Internet Explorer MS Excel MS Outlook MS PowerPoint MS Word Photo Viewer 7-ZIP Одновременная установка нескольких приложений |
Примечание | Использовались файлы большего размера, для графики – большее разрешение |
Для понимания типичной нагрузки в цифрах также приводится примерное потребление ресурсов каждым профилем (проценты относительно профиля knowledge):
Worker | Apps open | CPU usage | Disk reads | Disk writes | IOPS | Memory | vCPU |
---|---|---|---|---|---|---|---|
Knowledge | 5-9 | 100% | 100% | 100% | 8.5 | 1.5GB | 2 vCPU |
Power | 8-12 | 119% | 133% | 123% | 10.8 | 2GB | 2 vCPU |
Были проверены различные режимы работы VDI инфраструктуры, каждый из которых оказывал высокую нагрузку на All Flash массив.
- Provisioning – развертывание пула виртуальных машин
- Booting – загрузка виртуальных машин, эмуляция начала рабочего дня (так называемый boot storm
- Login VSI full test (Login) – поэтапное увеличение нагрузки в виртуальных машинах с целью достижения пика, когда производительность начнет деградировать из-за нехватки ресурсов (в данном случае стораджа). Пик не был достигнут, All Flash массив способен обеспечить производительность для большего числа рабочих столов даже в конфигурации нагрузки типа power
- 30 minute steady-state – 30-ти минутный тест на устойчивость с максимальной нагрузкой
- Power off – выключение пула виртуальных машин
- Pool Refresh – возврат диска с ОС к первоначальному размеру
В результате независимо от режима нагрузки сохранялось комфортное время отклика внутри виртуальных машин. Т.е., другими словами, это означает, что пользователь чувствовал бы себя комфортно при работе с подобным рабочим окружением.
Пул из 500 рабочих столов в режиме Linked Clone | Время выполнения | Средняя задержка |
---|---|---|
Provisioning | ~32 мин | 0.59ms |
Booting | ~2 мин | 0.68ms |
Login VSI full test (Login) | 50 мин | 0.46ms |
30 minute steady-state | 30 мин | 0.56ms |
Power off | ~7 мин | 0.45ms |
Pool Refresh | ~14 мин | 0.27ms |
Полные результаты тестов доступны на сайте Login VSI и AccelStor.
Вывод
Когда производительность хранилища реально имеет значение и All Flash массив работает в центре VDI инфраструктуры, системы, построенные на базе технологии FlexiRemap®, будут обеспечивать наилучшее соотношение цена/производительность. Использование enterprise SATA SSD и встроенный алгоритм по увеличению их срока службы вкупе с низкими задержками устройства в целом – это как раз то, что просто создано для использования в масштабных проектах VDI.