Seagate MACH.2 и Exos 2X14: разбираемся в преимуществах двойного привода

    Как увеличить производительность HDD?

    Seagate несколько дней назад начала поставки жестких дисков на технологии HAMR (heat-assisted magnetic recording, термомагнитная запись), которые были представлены еще в ноябре 2020, а также расширила программу тестирования HDD с двойным приводом MACH.2, которые обеспечивают в два раза более высокую производительность по сравнению с обычными жесткими дисками. Компания уверена, что подобный набор технологий позволит увеличить как емкость, так и производительность жестких дисков в ближайшие годы.

    Емкость жестких дисков — параметр очень важный, но если емкость, плотность записи и линейная скорость чтения/записи увеличиваются, случайные операции чтения/записи IOPS в расчете на терабайт снижаются, что негативно сказывается в сегменте дата-центров. Для повышения последовательной скорости чтения/записи и IOPS на терабайт производители HDD разрабатывают новые модели с двумя независимыми приводами, их рассматривать как два отдельных жестких диска в одном 3,5" корпусе. И Seagate стала первым производителем HDD, представившим технологию Multi-Actuator Technology (MAT) в конце 2017 года, а в 2019 году избранные партнеры компании получили тестовые образцы соответствующих накопителей Exos 2X14 MACH.2. К сожалению, до сих пор неизвестно, когда HDD Seagate с технологией MACH.2 станут коммерчески доступны. Будем надеяться, что это случится в 2021 году.

    «Первая на рынке технология двойного привода Seagate привлекла внимание широкой базы пользователей, которым требуются емкие накопители с высокой производительностью для таких сценариев, как доставка содержимого, — сказал Дейв Мосли, главный исполнительный директор Seagate. — Сегодня мы увеличиваем поставки накопителей с двойным приводом, и их доля будет расти по мере повышения емкости».

    Первая демонстрация в 2018 году: технология MACH.2 готовится покорить рынок

    Инженеры Seagate еще в 2018 году продемонстрировали полностью рабочий жесткий диск на основе технологии Seagate MACH.2 с двойным приводом, который позволяет одновременно считывать или записывать два потока данных с помощью стандартного адаптера SAS Host Bus Adapter (HBA) без какой-либо дополнительной настройки.

    Первые демонстрации технологии MACH.2 с двойным приводом были проведены на конференции OCP (Open Compute Project) Summit, которую посетили больше 3.400 разработчиков, инженеров и специалистов. Участники конференции смогли оценить преимущества решений Seagate в окружении дата-центров. Для демонстрации использовались накопители Seagate Exos 2X14 MACH.2 корпоративного класса с подключением SAS. Ниже, в соответствующем разделе статьи, мы приведем технические подробности теста.

    «Демонстрация показала преимущества производительности технологии MACH.2 на жестком диске Seagate Exos по сравнению с обычным Exos с одним приводом, — сказал главный инженер Seagate Тим Уокер. — В нашем примере нагрузка состояла из нескольких последовательных потоков — например, потоков видео. Мы не использовали какое-либо специальное аппаратное обеспечение — накопитель подключался к стандартному SAS HBA, который устанавливался в обычный слот расширения».

    В демонстрации участвовали два дисковых массива: «Первый массив с четырьмя накопителями MACH.2, второй — с четырьмя стандартными Exos с одним приводом, — пояснил Уокер. — Мы нагрузили массивы максимально возможным числом последовательных потоков параллельно, чтобы сохранить при этом минимально необходимую пропускную способность для QoS. В данном случае она составляла четыре мегабайта в секунду, качество видео при этом было достаточно высоким, сравнимым с домашними условиями»

    «Жесткие диски MACH.2 поддерживают порядка 230 параллельных потоков, а обычные Exos — около 130 — что довольно хорошо соответствует теоретическому удвоению производительности на микроуровне тестов, — заключил Уокер».

    Технология Seagate MACH.2 удваивает производительность традиционных жестких дисков, используя два раздельных привода, которые независимо друг от друга и параллельно выполняют операции доступа и чтения/записи для host-системы. На демонстрации в 2018 году технология Seagate MACH.2 позволила установить рекорд производительности жесткого диска, суммарная пропускная способность достигла 480 Мбайт/с — намного быстрее обычных жестких дисков и на 60% быстрее HDD на 15К об/мин. Теоретический уровень пропускной способности составляет до 520 Мбайт/с, о чем мы расскажем ниже.

    «Технология разработана для наших клиентов, которым требуется высокий уровень QoS по IOPS на терабайт. Его уже не обеспечивают жесткие диски с одним приводом, особенно при дальнейшем увеличении емкости и переходе на HAMR, — сказал Уокер».

    На мероприятии OCP Summit Тим Уокер и менеджер Seagate по продуктам для облаков Джеймс Борден показали раннюю версию технологии MACH.2 на жестких дисках Exos в работе. Они раскрыли архитектуру, производительность и характеристики энергопотребления MACH.2, как и возможность использования в окружениях гиперскейла. На приведенном видео Уокер рассказывает о работе MACH.2.

    MACH.2 отлично подходит для интенсивных нагрузок в дата-центрах

    Облачные дата-центры переводятся на жесткие диски все более высокой емкости, но при этом "узким местом" становится производительность IOPS в расчете на терабайт. Емкости продолжат свое увеличение в будущем, в том числе благодаря технологии HAMR и повышению плотности хранения данных на каждой пластине. Но законы физики неумолимы, и увеличение плотности записи снижает производительность IOPS.

    Технология Seagate MACH.2 как раз призвана уменьшить эффект подобных ограничений. То есть клиенты с интенсивными сценариями обработки данных, подобных онлайновому стримингу и виртуализации, смогут по-прежнему получать высокий уровень производительности жестких дисков, но при этом справляться с постоянно увеличивающимися объемами данных. Ниже мы рассмотрим технические основы технологии.

    За прошедшие после 2018 года месяцы инженеры Seagate продолжили совершенствовать технологию MACH.2, которая совсем скоро появится в корпоративных жестких дисках Seagate Exos. Партнеры Seagate уже давно тестируют накопители с HAMR и двойным приводом Seagate MACH.2 в своих лабораториях, причем некоторые уже публично поделились результатами. В конце статьи мы расскажем о практическом опыте Microsoft.

    «Мы попросили нескольких наших партнеров оценить накопители в своих системах — как под последовательной нагрузкой, так и под интенсивной случайной нагрузкой, например, почтового сервера, — сказал Уолкер. — И отзывы оказались действительно хорошими. Прирост производительности в реальных нагрузках составил 1,8-1,9 раз без каких-либо хитростей или сложных конфигураций. Простой переход на новые HDD обеспечивает почти двукратное увеличение производительности».

    Технические подробности MACH.2

    Настало время разобраться с техническими основами MACH.2. Ниже мы рассмотрим, что влияет на производительность HDD. Мы расскажем, как снижение IOPS/TB по мере увеличения емкости приводит к ухудшению TCO, и как технология MACH.2 позволяет этого избежать. Мы рассмотрим, почему был выбран именно такой дизайн MACH.2, как технология сказывается на производительности и энергопотреблении. Какие тонкости по командам существуют? Наконец, мы приведем несколько сценариев использования MACH.2.

    Что влияет на производительность HDD?

    Технология жестких дисков подразумевает использование движущихся компонентов, производительность при этом зависит от оборотов шпинделя и числа каналов, которые используются для передачи команд ввода/вывода. Исторически HDD наращивали производительность путем увеличения скорости вращения шпинделя, что привело к появлению 2,5" накопителей на 15К и 10К. Но из-за ограничений пространства 2,5" корпуса, подобные накопители не могли обеспечить высокий уровень емкости. В свою очередь, 3,5" HDD обеспечивают самый высокий уровень емкости, но не могут дать такую же скорость вращения шпинделя из-за высокого энергопотребления и слишком мизерного выигрыша, чтобы оправдать увеличение энергопотребления. Другие проблемы на высоких оборотах касаются вибрации корпуса и деградации производительности из-за ударов/вибрации во время работы.

    В качестве альтернативной меры повышения производительности 3,5" HDD было выбрано кэширование, однако оно помогает лишь в некоторых рабочих сценариях, да и преимущества невелики. Очередь команд — тоже мера повышения производительности, однако она может привести к увеличению задержек, приложения при этом нужно разрабатывать так, чтобы они умели работать с большой глубиной очереди (QD). Можно уменьшить ход головок на пластине (короткий ход, short stroking), что действительно повышает производительность случайного чтения/записи, снижая при этом и емкость. Головки при этом движутся в меньшем диапазоне, прирост производительности имеется, но такой шаг не эффективен по соображениям себестоимости, поскольку значительная часть емкости теряется.

    Проблема: IOPS/TB и TCO

    Операторы облачных сред используют в центрах обработки большое количество 3,5-дюймовых жестких дисков, из которых создаются узлы хранилищ для приложений, размещенные в многочисленных стойках. Чтобы выполнять соглашения об уровне обслуживания, нужно поддерживать определенный уровень производительности таких хранилищ с оценкой показателей IOPS и задержки выполнения команд. Требуемый уровень производительности определяется показателем IOPS в расчете на терабайт (IOPS/TB) при определенной задержке.

    Для многих облачных нагрузок IOPS/TB можно получить, разделив производительность случайного доступа IOPS накопителя на доступную емкость. И пока HDD соответствует заданному провайдером уровню IOPS/TB, можно использовать всю доступную емкость HDD. Если же уровень IOPS/TB находится ниже порогового значения для клиентской нагрузки, то всю емкость накопителя использовать уже не получается. И проблема сокращения полезной емкости из-за ограничения IOPS/TB приводит к критическому ухудшению совокупной стоимости владения TCO из-за роста затрат в расчете на терабайт полезной емкости.

    Иллюстрация выше как раз показывает проблему. По оси X отложена емкость 3,5" HDD класса nearline. По оси Y — производительность IOPS/TB, которая снижается по мере увеличения емкости из-за ограничений механики жесткого диска (увеличивать IOPS пропорционально емкости не получается). Зеленая область как раз показывает необходимый уровень производительности IOPS/TB для приложений клиента по массиву накопителей. Например, если порог производительности составляет 7 IOPS/TB, то без потери емкости можно использовать накопители на 12 Тбайт. Выше частью емкости уже приходится жертвовать, ограничиваясь примерно теми же 12 Тбайт. В итоге накопители большей емкости используются неэффективно, что ухудшает совокупную стоимость владения TCO.

    Современные HDD используют один привод для выполнения операций ввода/вывода, что дает один канал чтения/записи. В итоге накопитель дает фиксированную производительность, независимо от емкости и числа пластин/головок.

    Технология MACH.2

    Технология MACH.2 решает описанную выше проблему IOPS/TB, используя два привода, которые могут выполнять операции ввода/вывода независимо друг от друга в пределах одного HDD. Подобная параллельная работа обеспечивает практически удвоение производительности. Верхняя половина головок подключена к первому приводу, нижняя — ко второму. Таким образом, каждый привод получает половину емкости накопителя. На иллюстрации ниже показано, как два привода работают независимо друг от друга. А в таблице приведен прирост производительности MACH.2 по сравнению с одним приводом (обычные HDD).

    MACH.2

    Число приводов

    Емкость (TB)

    Случайные IOPS

    IOPS/TB

    SDR (MB/s)

    Измерения на уровне привода

    Н/Д

    7

    80

    5,7

    260

    Измерения на уровне диска

    2

    14

    160

    11,4

    520

    MACH.2 HDD обеспечивают теоретический двукратный прирост производительности по случайному вводу/выводу и/или по последовательной передаче данных, в зависимости от потребностей приложений и нагрузок.

    IOPS/TB и TCO

    MACH.2 удваивает производительность, что позволяет клиентам использовать всю доступную емкость HDD, поскольку уровень IOPS/TB превышает минимальную планку.

    На графике выше показаны требования того же клиента, которому ранее приходилось ограничиваться доступной емкостью 12 Тбайт из-за пороговой производительности IOPS/TB, теперь же он может использовать всю емкость HDD вплоть до 24 Тбайт.

    Переход с одного привода на MACH.2

    Как мы указывали ранее, требования каждого клиента различаются в зависимости от архитектуры хранения данных и используемых сценариев/приложений, поэтому и порог IOPS/TB разный. Именно данный порог определяет емкость, при которой следует переходить с одного привода на HDD MACH.2. Seagate считает, что большинству клиентских приложений требуется производительность HDD между 5 и 10 IOPS/TB. Ниже приведен сравнительный график с результатами MACH.2, которые позволят клиентам использовать максимум емкости, сохраняя минимально необходимый уровень IOPS/TB. Что обеспечит минимальную совокупную стоимость владения TCP в расчете на терабайты хранилища.

    Дизайн MACH.2

    Дизайн MACH.2 опирается на два привода, которые передают данные через отдельные каналы. В HDD используется множество проприетарных инноваций, которые гарантируют отсутствие взаимных конфликтов при одновременной работе двух приводов над операциями ввода/вывода. Дизайн MACH.2 ориентирован на максимальную производительность IOPS (то есть удвоение производительности по сравнению с одним приводом).

    При разработке MACH.2 особое внимание было уделено выбору интерфейса (SAS против SATA). Технология MACH.2 может работать с обоими типами интерфейса, но по причинам производительности и более простой архитектуры был выбран вариант SAS

    •  Производительность: SAS 12 Гбит/с против SATA 6 Гбит/с. Первое поколение MACH.2 довольно близко подходит к насыщению интерфейса SATA 6 Гбит/с (пропускная способность 600 Мбайт/с). Как было отмечено выше, накопитель обеспечивает производительность до 520 Мбайт/с SDR, а следующее поколение будет работать еще быстрее. Поэтому было принято решение, чтобы экосистемы и архитектуры хранения данных были готовы к следующему поколению накопителей MACH.2 без необходимости менять протокол интерфейса.

    •  Простая архитектура: два привода адресуются host-системой через логические номера устройств SAS LUN. Протокол LUN уже встроен в архитектуру интерфейса SAS, он позволяет обращаться к обоим приводам одновременно. LUN0 и LUN1 маркированы одинаковым глобальным именем WWN со стороны хоста с уникальными идентификаторами (LUN0 или LUN1). При подключении к хост-системе жесткий диск MACH.2 виден как два независимых накопителя равной емкости. Например, в случае 14-Тбайт HDD будут видны два накопителя на 7 Тбайт. На следующей иллюстрации приведена архитектура SAS на основе LUN.

    Производительность MACH.2 по тестам Seagate и партнеров

    MACH.2 обеспечивает прирост производительности до двух раз как по случайным операциям IOPS, так и по последовательной скорости передачи. Инженеры Seagate ориентировались на наиболее популярные сценарии и приложения, чтобы оптимизировать накопители под определенные значения глубины очереди (QD) и объемов передаваемых блоков (xfer).

    На иллюстрации ниже приведены результаты тестов IOMeter, где сравнивается производительность MACH.2 с накопителем Seagate Exos (сравнимый HDD с одним приводом). Преимущество MACH.2 над обычным Exos показано по оси Y, а значения QD и объемов передаваемых блоков — по оси X. Точные значения пропускной способности будут зависеть от модели HDD, которая сравнивается.

    По случайным операциям чтения MACH.2 показывает прирост производительности между 1,85x и 2x по сравнению с обычным HDD Exos с одним приводом. Конечно, при выполнении одинаковой нагрузки на обоих LUN.

    По последовательному чтению при высоких объемах передаваемых блоков (когда MACH.2 и Exos с одним актуатором входят в режим последовательной потоковой передачи), преимущество MACH.2 составляет 2x по сравнению с HDD с одним приводом. Конечно, при выполнении одинаковой нагрузки на обоих LUN

    Энергопотребление

    Как и предполагалось, использование большего количества электроники и движущихся частей приводит к тому, что HDD MACH.2 потребляет заметно больше, чем накопитель с одним приводом. Цель дизайна заключалась в сохранении теплового пакета 12 Вт при случайных нагрузках, наиболее важных для большинства облачных сценариев. В таблице ниже приведено сравнение энергопотребления нынешнего поколения накопителей Seagate Exos.

    Как видим, HDD MACH.2 показывает наиболее высокий уровень энергопотребления при последовательном чтении. Причина кроется в большем токе по линии 5 В из-за работы дополнительной электроники, связанной с чтением двух последовательных потоков.

    Как обнаружили специалисты Seagate, многие существующие на рынке системы с несколькими дисками ограничены пропускной способностью топологии SAS со стороны хоста, они не способны дать полную последовательную пропускную способность, которую могут обеспечить несколько HDD MACH.2 (520 Мбайт/с × число HDD). Поэтому для большинства клиентов режимом с самым высоким энергопотреблением будет случайное чтение, где мы получаем не такое большое увеличение по сравнению с одним актуатором, несмотря на двукратный рост производительности.

    Можно взглянуть и под другим углом: хотя на один диск MACH.2, такой как Exos 2X14, потребляемая мощность выше, на уровне TCO все же происходит снижение энергопотребления из-за уменьшения отсеков HDD. Один установленный накопитель MACH.2 потребляет меньшую мощность, чем два HDD с такой же пропускной способностью. Что показано на следующей диаграмме.

    Разница в командах MACH.2

    Поддержка SAS LUN приводит к тому, что некоторые команды работают с отдельными LUN, другие — с обоими LUN (то есть устройством в целом). Пользователям следует знать отличия по работе команд с накопителями MACH.2. Команды с высоким приоритетом HPC, такие как чтение или запись, адресуют LUN. Команды с низким приоритетом LPC могут адресовать как LUN, так и устройство в целом. В таблице приведены некоторые команды, на которые стоит обратить внимание при переходе на MACH.2.

    Можно проверить адресацию устройства или LUN для каждой команды, выполнив команду REPORT SUPPORTED OPERATION CODES и проверив поле MLU (multiple logical units) для каждой команды.

    Seagate активно работает над добавлением всех нюансов в стандарт T10, чтобы поле MLU как раз использовалось в случае накопителей с несколькими приводами. Документ T10 можно посмотреть по следующей ссылке:

    http://www.t10.org/cgi-bin/ac.pl?t=d&f=18-102r1.pdf

    MACH.2 в других сценариях

    Хотя технология MACH.2 призвана решить определенные проблемы дата-центров и облачных провайдеров, она хорошо покажет себя и в других сценариях. Среди них: сети доставки содержимого (CDN, особенно онлайновые потоковые сервисы), массивы RAID, распределенные файловые системы, включая Hadoop и Ceph, системы централизованного видеонаблюдения, масштабируемые файловые системы.

    Ниже приведены примеры сценариев, в которых Seagate готова привести результаты тестов.

    Онлайновые потоковые сервисы. Прирост производительности MACH.2 помогает провайдерам, использующим HDD для потокового вещания цифрового содержимого, улучшить качество предоставления услуг QoS своим клиентам и/или расширить число пользователей, которых можно обслуживать с прежней развернутой емкостью. В данных сценариях пользователи могут запрашивать потоки разных видеофайлов в любые моменты времени. Здесь на уровне приложения/ОС преобладают операции последовательного чтения в разных местах массива дисков. Поскольку расположения файлов могут быть произвольными, HDD необходимо найти нужный файл и прочитать его часть, прежде чем перейти к обслуживанию других потоков. В результате нагрузка на уровне диска больше соответствует случайному чтению блоков разной длины. Как можно видеть по результатам производительности MACH.2 выше, прирост по операциям случайного чтения составляет 1,8x по сравнению с одним приводом.

    В начале статьи мы уже упоминали демонстрацию на конференции OCP Global Summit Seagate, которая показала преимущества в конфигурации CDN, используя простой сервер хранения на FreeBSD OS. В демонстрации использовались несколько последовательных, взаимно не пересекающихся потоков с фиксированным битрейтом (вызовы чтения BSD libc) с массива 4× 14TB MACH.2 и 4× 14TB Exos NL SAS. Число потоков постепенно увеличивалось, пока система хранения не упиралась в ограничения пропускной способности, то есть уже не могла выдавать потоки с необходимой пропускной способностью. Максимальное число потоков здесь как раз соответствует возможностям подсистемы хранения.

    Как можно видеть, MACH.2 поддерживает 233 одновременных потока против 131 потока в случае накопителей с одним приводом. То есть мы получаем прирост порядка 1,8x по сравнению с HDD с одним приводом. Кроме того, массив MACH.2 показал меньшие задержки.

    RAID. Массив RAID — еще один пример, где видны преимущества технологии MACH.2. Под RAID понимается массив из нескольких накопителей в целях резервирования данных/избыточности и/или повышения производительности. Технология MACH.2 видна host-системе как два логических диска, поэтому массивы RAID могут строиться, начиная с одного HDD с двумя приводами. Конечно, такой вариант вряд ли разумен, поскольку избыточность RAID 1 на одном диске теряет преимущества, если накопитель выходит из строя.

    Ниже приведен пример MACH.2, который был продемонстрирован на 2019 OCP Global Summit совместно Seagate, Microsoft и Broadcom. Для данного демо использовались 11× накопителей MACH.2 и 11× Exos NL SAS с одним приводом в составе Microsoft J2010 Storage System с подключением к серверу Microsoft C2010 с HBA Broadcom 9400. У каждой группы накопителей использовался выделенный расширитель SAS и порты HBA, что позволило создать виртуальный диск Windows Storage Spaces на простом чередовании, то есть без избыточности и без уровня кэширования.

    Оба виртуальных диска нагружались операциями случайного чтения 16K или 32K, при этом глубина очереди регулировалась так, чтобы соответствовать заданным задержкам (30 мс в демо). На системе запускался тест Microsoft Diskspd. Глубина очереди QD виртуальных дисков увеличивалась, пока задержки не оказывались ниже порогового уровня. Значение задержек отображалось в реальном времени.

    Как можно видеть по результатам выше, накопители MACH.2 смогли выдать 1517 IOPS при QD 35 со средней задержкой 23 мс, а обычные HDD с одним приводом — 1011 IOPS при QD 27 со средней задержкой 27 мс. Данное демо показывает преимущество примерно в полтора раза по производительности IOPS, причем при меньшей средней задержке.

    Обратите внимание, что если и дальше увеличивать глубину очереди на MACH.2 RAID (что приведет к росту задержек), то пропускная способность будет повышаться и дальше. Впрочем, главной целью в данном случае было показать прирост производительности MACH.2 при одновременном снижении задержек.

    Hadoop. Hadoop предоставляет эффективный метод работы с данными с помощью распределенной файловой системы HDFS вместе с MapReduce (средство распределенной обработки для Hadoop). Чтобы продемонстрировать преимущество MACH.2 при использовании HDFS, Seagate на трех серверах создала небольшой кластер Hadoop. В демо master-узел (сервер) подключается к одному или двум slave-узлам, каждый содержал MACH.2 или обычные Exos NL с одним приводом.

    Здесь использовался тест Hadoop TestDFSIO, который запускает процесс MapReduce для параллельного чтения и записи файлов, чтобы оценить преимущество использования двух приводов. В данном тесте размер считываемых/записываемых файлов составлял 1 GB, число файлов масштабировалось от 1 до 1000+ при измерении пропускной способности чтения и записи.

    Как можно видеть по приведенным графикам, HDD с двумя приводам обходят жесткие диски с одним приводом в задачах Hadoop MapReduce как по записи (слева), так и по чтению (справа). Seagate планирует провести дополнительные тесты в будущем, чтобы оценить влияние дисков MACH.2 при увеличении числа slave-узлов.

    Microsoft удалось почти вдвое увеличить скорость ввода/вывода в ЦОД

    Наконец, позвольте отдельно рассказать о мнении корпорации Microsoft, которая протестировала жесткие диски Seagate Exos 2X14 с технологией MACH.2 в своих ЦОД. Специалисты Microsoft уверены, что жесткие диски Seagate Exos 2X14 с технологией MACH.2 обеспечат корпорации существенные преимущества, и планируют увеличить емкость хранилищ центра обработки данных в расчете на каждый слот при одновременной поддержке такого уровня операций ввода/вывода в секунду (IOPS), который необходим для Azure, Exchange Online и других облачных сервисов. Уже в ходе первых тестов подтвердилось, что технология MACH.2 позволяет достичь поставленных целей при выполнении рабочих нагрузок с высокими показателями IOPS.

    Microsoft тестирует Seagate Exos 2X14 с двухприводной технологией MACH.2

    Microsoft завершила первый раунд функциональных испытаний Exos 2X14, включая полный цикл тестирования на совместимость и взаимодействие с имеющейся инфраструктурой ЦОД, а также испытания на эксплуатационную надежность и легкость интеграции с системной архитектурой Project Olympus. Кроме того, была проведена оценка повышения производительности, обеспечиваемой MACH.2, ― наиболее важного для архитекторов ИТ-систем преимущества.

    ИТ-архитектор Microsoft Аарон Огас сотрудничает с Seagate с самого начала разработки MACH.2, участвуя в решении вопросов, связанных с предстоящим использованием технологии в облачной среде компании.

    «Мы активно тестировали инженерные образцы Exos 2X14, а недавно провели испытания опытных серийных экземпляров накопителя, — сообщил Огас. — Как показали результаты, наши расчеты оправдались: благодаря MACH.2 пропускная способность и IOPS возрастут почти вдвое».

    Для проверки возможностей накопителей MACH.2 в корпорации используют хорошо зарекомендовавшие себя инструменты, в частности Microsoft Exchange Server Jetstress. Эта система имитирует нагрузку сервера по операциям ввода/вывода при работе Exchange 2013 и 2016, позволяя оценить производительность и стабильность дисковой подсистемы. Помимо прочего, выполнены испытания с контролем IOPS в режиме последовательного считывания с имитацией операций резервного копирования и поточной передачи, а также в режиме случайного считывания при моделировании рабочих нагрузок гипермасштабной среды и сети доставки содержимого.

    «Тестирование с имитацией различных рабочих нагрузок выполняется уже довольно долго, — отмечает Огас. — Мы взаимодействовали с Seagate еще на этапе разработки MACH.2, следя за тем, чтобы характеристики технологии соответствовали нашим требованиям. Главной целью было достижение почти вдвое большей пропускной способности по сравнению с одноприводными накопителями, которые мы сейчас применяем. Как показали испытания, MACH.2 справляется с этой задачей».

    MACH.2 позволяет получить необходимые показатели по IOPS в расчете на терабайт и по стоимости в расчете на терабайт

    Как мы отмечали ранее, операторам облачных сред нужно поддерживать определенный уровень производительности хранилищ с оценкой показателей IOPS и задержки выполнения команд. Требуемый уровень производительности определяется показателем IOPS в расчете на терабайт (IOPS/TB) при определенной задержке.

    Архитекторы центров обработки данных предлагают рассмотреть и другой способ достижения высоких уровней IOPS ― использование твердотельных накопителей. Это может иметь смысл при определенном соотношении их совокупной стоимости владения и потребностей имеющихся приложений в емкости, IOPS и пропускной способности. Благодаря меньшей стоимости в расчете на терабайт и преимуществу по емкости, жесткие диски позволяют сформировать хранилище большой вместимости, характеризующееся лучшей экономической эффективностью, — но только если накопители могут обеспечить необходимый уровень IOPS.

    Технология Seagate MACH.2 обеспечивает высокие показатели IOPS/TB за счет использования двух независимых приводов в одном жестком диске, создающих два параллельных потока данных и, соответственно, удваивающих производительность. Первый привод управляет верхней частью блока считывающе-записывающих головок, второй — нижней частью. Каждый из приводов отвечает за половину общей емкости накопителя.

    Преимущества для серверной архитектуры Microsoft Exchange, обеспечиваемые технологией MACH.2

    В облачных центрах обработки данных, как правило, нет лишнего места для установки оборудования, поэтому операторы стараются увеличивать скорость ввода/вывода в расчете на каждый слот.

    Накопители MACH.2 будут использоваться для всех облачных сервисов Microsoft, включая Azure и Exchange. Учитывая, что в дата-центрах облачных операторов работает очень много приложений, для них актуальна задача экономия площади. Microsoft планирует уменьшить расходы в расчете на слот, которые формируются из затрат на размещение оборудования, энергопотребление, охлаждение и т. д. Если установленные жесткие диски начинают демонстрировать снижение показателей IOPS, заказчик ищет способы решения этой проблемы, к примеру, путем установки накопителей с двумя приводами.

    Архитектура Microsoft Exchange постоянно оптимизируется, чтобы обеспечивать максимальную пропускную способность серверов. Технология Seagate MACH.2 позволит устанавливать для Exchange все более вместительные жесткие диски с сохранением возможности выполнения заданных в SLA требований к величине задержки. Благодаря новой платформе Seagate в дата-центрах Microsoft можно будет устанавливать более вместительные жесткие диски — 14-терабайтные Seagate 2X14, поскольку MACH.2 предоставляет возможность достижения пропускной способности, необходимой хранилищам Exchange, емкость которых постоянно увеличивается.

    MACH.2 предотвращает появление неиспользуемой емкости

    Пока жесткий диск обеспечивает нужный клиенту уровень IOPS/ТБ, вся его емкость остается доступной для использования, но если показатель IOPS/ТБ падает ниже порогового значения, установленного с учетом рабочей нагрузки приложения, часть емкости остается незадействованной. Причины мы рассматривали выше.

    «До недавних пор рост скорости передачи данных у жестких дисков не успевал за ростом их емкости, — объясняет Джеймс Борден, менеджер Seagate по продуктам для облаков. — Без мультиприводной технологии, когда определенный порог емкости превышен, требования по качеству обслуживания выполняться уже не будут ввиду ограничений, определяемых характеристиками пропускной способности накопителя. Пример: чтобы обеспечивать определенное качество обслуживания, жесткий диск емкостью 16 ТБ должен иметь вдвое большую пропускную способность, чем накопитель 8 ТБ. Если приложение начинает создавать более высокую нагрузку по IOPS, чем может обслужить жесткий диск, единственный выход — размещать на нем меньше данных, то есть появляется неиспользуемая емкость. Частичное решение проблемы незадействованной емкости — принцип «короткого хода». Он состоит в том, чтобы размещать часть данных на внешнем диаметре диска, а внутренний использовать для менее критичных данных, которые не нужно предоставлять с самыми высокими показателями качества обслуживания. Таким образом можно избежать наихудшей ситуации, когда жесткий диск заполняется лишь на две трети. Но методика короткого хода усложняет управление данными и все-таки не дает гарантии загруженности всей установленной емкости».

    При использовании Exos 2X14 с MACH.2 прибегать к тактике короткого хода уже не нужно — во все слоты в центре обработки данных можно установить двухприводные жесткие диски емкостью 14 ТБ. Для приложения пропускная способность будет почти такой же, как при использовании двух 7-терабайтных накопителей, но задействован будет только один слот.

    Технология MACH.2 разработана совместно специалистами Seagate и Microsoft с учетом требований провайдеров облачных сервисов

    Конструкция и функции первых двухприводных накопителей Seagate реализованы в точном соответствии с требованиями заказчиков. Microsoft тесно сотрудничала с Seagate на этапах разработки MACH.2 и выпуска двухприводных накопителей.

    «Разрабатывая MACH.2, мы взаимодействовали со специалистами дата-центров Microsoft, — сообщил Крис Хенсли, руководитель Seagate по глобальным продажам продукции для облачных приложений. — Они оказывали нам большую поддержку еще на стадии первоначального замысла. Мы вместе адаптировали многоприводную архитектуру MACH.2, добиваясь достижения нужного уровня IOPS на терабайт, о чем просили специалисты Microsoft».

    «Эксперты Microsoft помогали нам ценными советами на всех этапах, начиная с создания первых опытных образцов, — добавил Борден. — Инженеры Microsoft принимали участие в проектировании архитектуры накопителя, заботясь о том, чтобы конечный продукт отвечал требованиям корпорации. Это сыграло ключевую роль при разработке первого поколения накопителей MACH.2, в которых предусматривается использование двух логических номеров устройства с SAS, что соответствует требованиями архитектуры центров обработки данных Microsoft и других крупных операторов облаков».

    По мере дальнейшего осуществления программы развития двухприводных жестких дисков Exos 2X14 семейство этих накопителей будет пополняться устройствами различных типов, соответствующих требованиям самых разных приложений корпоративного класса.

    Заключение: рынок готов к двойному приводу, Seagate тоже

    Seagate, лидер рынка накопителей, готовится к скорому выходу жестких дисков с двойным приводом MACH.2. Жесткие диски позволяют продолжить наращивание емкости с одновременным снижением себестоимости, поэтому они остаются доминирующим способом хранения данных на всех рынках. Корпоративные 3,5" HDD на 7200 об/мин практически удвоили емкость за последние пять лет, сохранив низкую цену и стабильный уровень производительности. Данные HDD удовлетворяют требованиям экзабайтных облачных инфраструктур. HDD и в будущем продолжат предлагать больше емкости по меньшей цене, но, чтобы выжать из жестких дисков максимум, они должны обеспечивать стабильно высокий уровень производительности. И технология двойного привода MACH.2 как раз обеспечит сохранение производительности при дальнейшем увеличении емкости 3,5" HDD, соответствуя при этом поставленным целям по совокупной стоимости владения (TCO) или даже превосходя их.

    Технология MACH.2 является проверенным решением для ускорения производительности при снижении задержек выполнения команд. Все больше сценариев в дата-центрах упираются в ограничения IOPS/TB, и технология MACH.2 как раз способна их разрешить, снизить совокупную стоимость владения TCO, а также обеспечить дальнейший рост производительности и емкости.

    Спецификации накопителей Exos 2X14 можно посмотреть здесь.

    Seagate
    Лидирующий разработчик решений для хранения данных

    Комментарии 30

      +4
      Сначала подоят народ на MACH-2, потом на MACH-4, MACH-8, затем перекомпонуют расположение элементов конструкции и добавят с противоположной стороны еще один блок головок… Угу-угу, понятно.

      Самое смешное что вы могли это сделать раньше. Я видел насколько компактная механика в однодюймовых и 1.8" дисках.

      Удачи вам проиграть гонку накопителей.
        +2
        Что значит подоят? Не нравится — не покупайте
          +2
          Не нравится — не покупайте
          А я и не покупаю, что ясно из моего комментария. Почему вы решили обратное?

          Ах да, Вы, как и большинство использующих фразу «Не нравится — не покупай/голосуй/живи/etc.», имели же в виду нечто другое, не так ли? «Не нравится — не покупай и молчи в тряпочку»?

          Не дождётесь.

          Я не покупаю, и довольно прямо поясняю почему. Могу объяснить очевидное, если уж меня кто не понял:

          Что значит подоят?

          Резерв технологий, так же известный как "+5% в год"

          В случае отсутсвия конкуренции, олигополии или картельного сговора, фирмы занимаются имитацией прогресса, выдавая пять, а то и десять лет как созданные и проверенные «инновации» по чайной ложке в год, собирая с каждым обновлением модельного ряда свою жатву с толпы идиотов.

          tl;dr: я против тех, кто тормозит прогресс ради своих меркантильных интересов и не стесняюсь выражать своё мнение относительно этого.
            0
            Резерв технологий, так же известный как "+5% в год"
            С точки зрения инвестора, когда год от года стандартное отклонение прибыли компании небольшое — гораздо лучше, чем когда один год компания выпускает вундервафлю и получает бешенную прибыль, а следующих 10 лет до очередного прорыва еле сводит концы с концами.
          0

          А какой еще смысл в такой технологии? Продать еще дисков для бэкапов? Потому что ставить страйп (состоящий в данном случае из одного накопителя) ради производительности, в угоду отказоустойчивости — это очень рискованное решение.

          +4
          2 блока головок в 1 винте. А в чем тогда разница по сравнению со страйп рейдом из 2х отдельных винтов? А сколько стоит этот чудо винт? Не получится ли так, что за его цену можно построить рейд из нескольких винтов гораздо более производительный и отказоустойчивый?
            0
            Вся прелесть в том, что два разных запросa от разных пользователей к СУБД сервера получат свои даные без задержек на обработку стороннего запроса. :)

            P.S. 2-е независимые головки к доступу данным на жёстком дискe — это не предел технологий.
              0

              Перечитайте внимательно статью. Там честно написано, что прирост только если данные на разных лунах, а как это получится при последовательной записи?

              0

              Возможно тише, потому что крутящий блины двигатель один?

                +1
                Решение ориентировано на серверы так что тишина там без разницы. Вот потребление засчет 1 мотора это да.
                  0
                  Ну при большой нагрузке там все энергопотребление и энерговыделение за счет двигателей, перемещающих головки. И это проблема.
                +2
                В статье указан аргумент за эту технологию — выжать больше IOPS из каждого слота (подразумеваются SAS-слоты, как я понимаю).
                То есть разница в том, что не меняя кол-во дисков, подключенных к системе, заметно повышаем IOPS всей дисковой системы.
                И, полагаю, стоимость аренды нового шасси с дисками и контроллером превысит стоимость замены дисков в уже имеющемся шасси.
                  +1
                  Согласен, не взлетит. Сложность производства и как следствие цена вырастут. К тому же дополнительный блок головок в одном устройстве это дополнительные вибрации, а соответственно ошибки позиционирования. В полке из 2-3х десятков дисков весь прирост iops убьется возросшим уровнем вибрации.
                  Скажем так. Возможно года через 2-3 эти диски и пойдут в серию, но это будет нишевое решени наряду с SMR.
                  К тому же, к этому времени те же QLC SSD будут уже иметь соизмеримую цену при несравнимом уровне iops.
                    0
                    Разница в том, что это явно рассчитано на серверное применение, а там зачастую критично важно, сколько дисков можно впихнуть в одну стойку. И поэтому по общей стоимости выгоднее взять один HDD максимальной емкости, чем два более мелких, пусть и с меньшей стоимостью в пересчете на тербайт
                      0

                      Разница в том, что кто-то знает и понимает как это работает, а кто-то бездумно верит маркетингу. Количество дисков в стойке сейчас ограничено вибрацией дисковых полок, а не размерами дисков. Это явно прописано в вендорской документации на схд.

                      0
                      Del
                      0
                      То есть данные должны быть равномерно размазаны по двум половинам диска?
                      Иначе если грубо говоря данные оказались на верхней половине диска, то и работать будет только один блок головок.

                      Ну и закономерный вопрос, а почему только 2 блока? Раз придумали как разделить данные, тогда каждую головку надо сажать на индивидуальный привод…
                        +2
                        И закономерный вопрос — почему актуаторы было не поставить друг напротив друга (под 180 градусов), чтобы читать можно было с одного и того же блина.
                          +1
                          Уменьшив при этом диаметр дисков и увеличив их скорость.
                          0

                          Это два винта в одном. И ОС их видит как два. Так что в RAID0 их и будет размазано равномерно.

                            0
                            Ах вот оно что… тогда понятно
                          +1
                          Интересно, почему отказались от 5,25" дисков. Полезная площадь дисков больше. Скорость вращения диска меньше, при сравнимой линейной скорости.
                            0
                            Вибрации, шум, время доступа.
                              0
                              Я тоже считаю, что можно было бы выпустить винты в корпусе размером с 1 или даже 2 5,25" отсека. Ну да, занимают больше места, ну и что, почти во всех системниках место для этого предусмотрено, а оптические приводы мало кто ставит. Зато намного больше ёмкость.
                              0

                              Вообще — выглядит, как попытка найти сегмент, где диски ещё смогут потолкаться с SSD.
                              Как инженерное решение — великолепно.
                              Но как конкурент твердотельникам эти диски маловероятны. Разве что за исключением узких сценариев, когда нужно много дешевого места под "теплое" хранилище, и при этом нельзя выделить горячее подмножество, чтобы успешно закэшировать на SSD.

                                0
                                а что будет с RAID5 из 3-х таких дисков: всего 6 логических устройств, но при поломке диска отваливается сразу два из шести и RAID в оффлайн?
                                  0
                                  такие решения не для масштаба в 6 устройств. Думаю, что надежность такой шутки не сильно хуже чем у двух отдельных дисков (считаю что повреждения дисков и поломка головок будут относительно независимыми)
                                  0
                                  Забавно, почему-то вспомнил из-за этой статьи очень старую презентацию Maxtor. Они там показывали два блока головок. Один блок содержал головки, читающие с верхней части пластин, другой блок читал с нижней части пластин. Только блоки находились рядом друг с другом, не на одной оси. Забавно то, что Seagate в своё время купил команию Maxtor. Многие «инновационные» вещи в IT были придуманы давным давно…
                                    0
                                    Дааа, интересно. Тенденция такова — надёжность диска как объекта интересует все меньше, значение имеет именно совокупная ёмкость стойки/совокупную скорость. Как отдельное устройство или пару таких в сервак — нафиг, не уверен в надёжности, но если таких будет сразу штук 30… главное, чтобы новинки разом не стали выходить из строя.
                                      0
                                      Два диска в одном корпусе на одном шпинделе. Из основных плюсов: меньше шлейфов для подключения.
                                      Данная технология это как магазин с двумя отделами: продуктовый и хозяйственный, пока потоку покупателей равномерно требуются разные типы товаров, оба продавца равномерно загружены. Однако в ситуации когда поток покупателей пойдет только за продуктами, продавец хозяйственного отдела будет простаивать (и наоборот), кроме того, если один продавец подвернет ногу, то его отдел полностью или частично будет недоступен.
                                      Тут я сумбурно описывал, но не добил математикой ТМО тему, (кстати там в комментариях есть видео старого подобного решения, БГ еще на сервоприводах): если два (три, четыре...) блока головок не будут создавать турбулентность друг-дружке работая с одним набором плоскостей, то в принципе можно удвоить IOPS без ускорения скорости вращения блинов.

                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                      Самое читаемое