Как стать автором
Обновить

Комментарии 86

18TB HDD в розницу стоит €600 (только что в интернет-магазине проверил). Так что я не уверен, что цена тут существенно отличается от шпинделей. Выключенный шпидель тоже не потребляет электричества, а время доступа (даже с учётом spin up) значительно меньше.

Это всё не отменяет плюсов плёнки, но указывать на такие конские цены как на аргумент - спасибо, не надо.

200$ против 600$ - т.е. в 3 раза. ИМХО, разница весьма заметная, особенно когда речь пойдет на пентабайты. Да и диски придется объединять в распределенные системы минимум с 2х кратной избыточностью...

А плёнку вы предлагаете хранить в единственном экземпляре? Ух. А если шпилька застрянет, или лента на головку намотается?

Данные можно писать сразу на две кассеты. Таким образом получится дубликат.
НЛО прилетело и опубликовало эту надпись здесь
С жесткими вариант «каждый день вынуть один, воткнуть другой» не получался вообще, роботов не нашли таких)))
Одноплатник + переключатели — решение готово. А вообще, уже есть много готового (в том числе и для внешних дисков с USB). Например, ручное и автоматизированное.
НЛО прилетело и опубликовало эту надпись здесь

Ну, бэкап в единственной копии всегда можно сделать. У него есть проблема - если он механически пострадал (заводской дефект, сбой в ПО читалки, перенатянувшей плёнку, аппаратный сбой читалки (муха прилипла на головку) и т.д.), то вы остаётесь без бэкапа.

В мире жёстких дисков уже давно считается неприлично что-то писать на единственное устройство. На плёнке всё ещё допускается, хотя я не понимаю, почему.

НЛО прилетело и опубликовало эту надпись здесь
Как-то непонятно, зачем собирать RAID0 из дисков(если я правильно понял «Потому что при сбое одного жесткого — я потеряю все 21 старых бекапов до сего момента.») и говорить что это плохо, а ленты по отдельности — хорошо. Так и диски используйте по отдельности и будет то же самое. Ну или RAID6 хотя бы, раз уж хочется собрать все вместе.
НЛО прилетело и опубликовало эту надпись здесь

А чем это отличается от blob-хранилища с size=1 на HDD? Теряются только данные на потерявшемся диске. Однако, в мире HDD так делать считается неприлично.

НЛО прилетело и опубликовало эту надпись здесь

А у плёнки всё хорошо?

Remove Stuck Tape From IBM LTO1 Tape Drive
https://www.youtube.com/watch?v=sLIDYg4vy8E

Соседняя статья говорит про слипание плёнки и механическую усталось пластика.

Всё бы хорошо, но за $600 с HDD вы получаете готовое решение, которое можно подключить к компьютеру и работать. А для плёнки нужен ещё привод. И вот тут как раз основная проблема для домашних бэкапов (для компаний, которые террабайтами сохраняют инфу это, понятно, выгодно).

Цены на LTO-4 (при том, что в статье речь уже о 9 версии стандарта) начинаются от 150 тыс. рублей. Возможно, б/у можно найти дешевле, но даже с учётом этого для простой домашней коллекции "фильмов / видео в 4К / фото" кажется выгоднее NAS поставить с каким-нибудь RAID 1.

НЛО прилетело и опубликовало эту надпись здесь
Для обязательного хранения логов всяких хорошо. Для крупного проекта там реально терабайты набегают. Для оперативных задач за большой срок держать не нужно, месяц допустим в горячем на HDD в удобном «логсташе». А все старье до х лет сырым жмущимся на ленту и на полку. Зато уж когда приспичит, то лучше бы гарантированно восстановить.
Но если механика сдохнет, то оперативный ремонт или замена могут нервы потрепать. Особенно если техника вендора железки не хотят в ДЦ пускать.
НЛО прилетело и опубликовало эту надпись здесь
Так если робот с касетами на 48 и программа бекапов прикручена к ней, то вы этот месяц легко с лент восстановите чуть ли не быстрее, чем из зашифрованных архивов бекапы будете разворачивать.

Немного не то. Вероятность, что мне понадобятся логи в течении месяца может быть высока и проще держать их на HDD. Но параллельно лить и на ленту. Если скорость заполнения ленты и частота запросов старых логов позволяют, то роботом можно назначить ответственного сотрудника. Который и кассеты поменяет и привезет нужную для восстановления по запросу. Он то дешевле робота-робота будет?
НЛО прилетело и опубликовало эту надпись здесь

А ещё HDD покупается в комплекте со «считывателем», но стоимость гигабайта у плёнки почему то считают без его стоимости.

НЛО прилетело и опубликовало эту надпись здесь

В цене терабайта готового хранилища. Например, для 100ПБ хранилища, вот вам математика:

8/10 erasure coding на HDD потребует 10 HDD на каждые 8 HDD данных. К каждым 36 HDD требуется экспандер, бэкплейн и external SAS кабель. К каждым 8 JBOD'ам требуется сервер с двумя 4-х портовыми SAS контроллерами. Каждые 24 сервера потребуют коммутатор. Получается, юнит (стойка с 2 юнитами хранения, 8 x 2 x 36) на 576 HDD, с 460 полезной нагрузки. С 18 ТБ дисками стойка хранит примерно 8.2ПБ данных, примерно 13 стоек вместе с hotspare юнитом (8 JBOD'ов) и коммутаторами.

Теперь его же экивалент в плёнке. Во-первых, сколько копий хранить? Erasure coding для плёнок не применим, так что, минимум, в двух копиях. Во-вторых, сколько устройств чтения и роботов для библиотек? Минимум 2, потому что иначе нет spare.

Я не знаю чей бюджет лучше сойдётся. И кто лучше масштабируется. Вот в чём выиграет плёнка - это в энергопотреблении при постоянном, но редком доступе. Если эта штука работает как холодное хранилище, куда только бэкапы пишутся, то я не знаю кто экономнее.

НЛО прилетело и опубликовало эту надпись здесь

100ПБ хранилище, стоимость 1 ТБ. Или как эту идею ещё раз объяснить?

НЛО прилетело и опубликовало эту надпись здесь

Большое спасибо за разъяснение. При том, что для HDD так же существуют "HDDLib" решения (у меня такое было несколько лет назад - порядка 30 HDD в специальном хранилище с возможностью подключить только 2 шт за раз, вручную), но мы рассматриваем вариант, в котором полная ёмкость хранилища доступна через сетевое API или напрямую, т.е. без визитов on-sites.

Ключевые элементы для решения на HDD я указал - SAS-контроллеры, JBOD'ы, SAS-кабели, свитч над серверами (которых не так уж и много).

Так что давайте сравнивать с решением, где каждую кассету можно адресовать программно, без биоробота.

НЛО прилетело и опубликовало эту надпись здесь
И кто лучше масштабируется

лента интереснее в сценарии «делаем копии и никогда их не удаляем, масштабирование объёма обходится гораздо дешевле, да.

НЛО прилетело и опубликовало эту надпись здесь
Не, лента ещё хороша в сценарии делаем копии и не трогаем до момента оборота бекапов.

я считал, у меня получалось заметно дороже, чем массив hdd


то по сути у вас 39 последовательных копий физически недоступных для, считай, всех зловредов

ИМХО проблема надумана, если не совершать явных ляпов, то вряд ли резервное хранилище станет жертвой зловредов.
хотя сейчас подумал, есть случаи, когда лента гораздо надёжнее, например, от злонамеренного админа, который при увольнении решил всё поломать, лента защитит.

НЛО прилетело и опубликовало эту надпись здесь

В деньгах не берусь сказать, но в юнитах у меня получилось 9 стоек на дисках (за основу брал https://www.supermicro.com/en/products/chassis/4U/947/SC947HE2C-R2K05JBOD) и 1 на ленте https://buy.hpe.com/ru/ru/storage/tape-storage/tape-libraries/tape-libraries/hpe-t950-tape-library/p/1009502810, причем это еще прошлое поколение ленты, а объем уже почти в 4 раза выше обозначенного.

вот интереснее было бы и в деньгах тоже )


ещё вопрос с какой скоростью делает бекапы эта стойка с лентами? как реализовано одновременное создание бекапов из нескольких источников?

Не быстро: "Скорость передачи 388,8 Мбит/с, максимум". Скорее всего никак. Подобные решения обычно берут как 3 линию бэкапов, например когда нужно иметь консистентный бэкап за каждый день в течении лет десяти.

НЛО прилетело и опубликовало эту надпись здесь

да, только каждый привод (или как оно по-русски?) lto-8 стоит полмиллиона )

НЛО прилетело и опубликовало эту надпись здесь

Можно и на сильно большее количество, два стримера это начальный уровень. И да, делить на логические библиотеки и отдавать каждую своему бэкаперу.

О, они научились 90 дисков в 4U засовывать. Я исходил из 36-38. Да, тогда ещё плотнее станет.

Полочка да, получается компактнее.

90 дисков — это Supermicro, например, причём это будет сервер с памятью и парой процессоров. К нему останется только софт и сетевые коммутаторы добрать.


Альтернатива — какой-нибудь Western Digital, которые продают полки на 102 диска. Но у них это уже простая SAS полка, к которой нужен сервер с контроллерами.


Так что 100ПБ решение с дисками получается достаточно компактным.

90 дисков — это Supermicro, например, причём это будет сервер с памятью и парой процессоров. К нему останется только софт и сетевые коммутаторы добрать.

нет, конечно же, это просто полка (jbod chassis в терминах микры).


диски там занимают почти весь объём


6 рядов по 7+8 дисков, в центре ряд экспандеров, сзади блоки питания, вентиляторы и разъёмы.


хотя при большом желании материнскую плату с процессором и памятью там можно было разместить, да (БП имеет глубину почти 30 см).

https://www.supermicro.com/en/products/system/Storage/4U/SSG-640SP-E1CR90


Dual Socket P+ (LG-4189)
3rd Gen Intel® Xeon® Scalable processors
Support CPU TDP 120-205W


Memory Capacity: 16 DIMM slots
UP to 4TB: 16x 256 GB DRAM
Memory Type: 3200MHz ECC DDR4 RDIMM;LRDIMM


90x 3.5" hot-swap SATA3/SAS3 drive bays (4x 2.5" NVMe dedicated)
2x 2.5" 7mm drive bays
2 M.2 NVMe

ну до этого обсуждали не эту микру )


хотя вы правы, для задачи «набить стойку кучей дисков на серийном оборудовании» этот сервер выглядит предпочтительнее, чем сервер + несколько внешних полок.

Кстати, когда поправили насчет гига- и тера- - прикинул, а ведь емкость носителей - величина, которая больше всего выросла за 40 лет. Тактовая частота процессоров выросла с 3 МГц до 5 ГГц - на три порядка (производительность больше). Объем оперативной памяти - с 1 МБайт до сотен гигабайт - шесть порядков, скорость локальных сетей с 10 МБит до 10 Гбит - тоже три порядка.

А объем носителей - с десятков мегабайт до сотен петабайт - на 10 порядков, вот это прирост ;)

Объем оперативной памяти — с 1 МБайт до сотен гигабайт — шесть порядков, скорость локальных сетей с 10 МБит до 10 Гбит — тоже три порядка.
А объем носителей — с десятков мегабайт до сотен петабайт — на 10 порядков, вот это прирост ;)

если вы сравниваете с xt, то десятки мегабайт был единичный накопитель, сейчас топовый единичный накопитель десятки терабайт, так что прирост на 6 порядков, как и памяти.
если же говорить о серверах, то там и терабайты вполне доступы, и стагигабитная сеть. ради интереса накидал в одном компьютерном супермаркете конфиг на 2 Тб памяти, 100 Ġbps сеть и 2×6.4 TB ssd — получилось два миллиона.

Да, согласен - системы хранения данных на жестких дисках гигабайтных объемов 40 лет назад уже были. :(

Меня уже опередили и в ответ на ваш вопрос описали разумный способ сравнения комплексов, выполняющих схожие задачи. А то, что зелёное не получается сравнить с холодным, никак не оправдывает попыток это делать под предлогом «а как ещё вы их будете сравнивать?»

НЛО прилетело и опубликовало эту надпись здесь
А если бы вы строили систему типа AWS Glacier с временем обращения к данным в сутки, то на чем выгоднее было бы? Просто вокруг нее ходит много спекуляций — commodity hdd, ленты и робот blu-ray. На ваш взгляд какое из этих решений было бы максимально дешевым?
НЛО прилетело и опубликовало эту надпись здесь

стабильность магнитных характеристик покрытия из феррита бария в течение более 50 лет

Непонятно только, где через 50 лет раздобыть плеер для этой кассеты.

НЛО прилетело и опубликовало эту надпись здесь

Там в них микроконтроллеры, которые дохнут просто от времени - диффузия и броуновское движение за десятики лет убъёт транцисторы.

Ну а если там внутри что то типа пассика (тут я не знаю, только додумываю), то он за это время тоже рассыпется.

Из реального опыта:
Прижимные ролики и головки — расходный материал (причём недешёвый).

Долго стоявший на складе привод нужно «оживлять» — механика же. Там смазать, там почистить и т.д. А если его специально не консервировать — так вообще может за пару лет выйти из строя (может и не выйти — по разному бывало).

Но если сильно припечёт — можно и новый сделать «на коленке». У нас так ребята восстанавливали данные. Читали и цифровали сигнал по частям, потом парсили оцифровку в нулики и единички (я им тут немного помогал). Одна кассета — почти месяц работы (без учёта создания «магнитофона»).
Ну и стримеры дохнут от километража, вроде, а не от времени.

а какого порядка ресурс?

НЛО прилетело и опубликовало эту надпись здесь

Через 50 лет и с HDD могут проблемы возникнуть - попробуйте сейчас MFM какой-нибудь прочитать, тот же популярный в свое время ST-225 (у нас такие в школе стояли, возможно, где-то они еще лежат с бесценными ученическими работами). Прошло всего 40 лет с момента выпуска ;)

НЛО прилетело и опубликовало эту надпись здесь

всё-таки это задачи немного разного уровня: прочитать единичный накопитель прошлых времён и поддерживать в рабочем состоянии систему бекапов больших объёмов информации в течение десятков лет.


вторую задачу можно решить и лентами, и массивами дисков, и там, и там потребуется замена вышедшего из строя и планомерный апгрейд.

По скорости чтения/записи 400 МБ/с нативно (1000 МБ/с со сжатием) эти накопители превосходят современные HDD и SSD.

гхм, превосходят hdd и некоторые бюджетные ssd (в основном sata) и существенно проигрывают всем sas ssd и практически всем dc nvme.
плюс в массивах hdd/ssd читать/писать могут все носители одновременно, а в ленточной библиотеке всё не так.

Это они еще скорость случайного доступа не сравнивали (между ssd и их кассетами).

хм, сейчас решил проверить свои прикидки, смотрю:
Стриммер HPE R1R75A
его же можно просто подключить по sas к любому серверу с hba и периодически менять кассеты?


вроде бы и бюджетно получается, сервер с 20x16ТБ HDD у нас вышел миллион, а тут в три раза дешевле можно примерно тот же объём на лентах обеспечить.

а, нет, к нему ещё нужен сам привод, что несколько увеличивает стоимость )


впрочем, появилась мысль купить внутренний привод и руками менять раз в день ленты.

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Эх, когда же появится для народа современный АрВид...

Неясно, как там с обратной совместимостью.

Неясно, можно ли в теории прочитать данные без контроллера конкретного привода, то есть простая ли структура их хранения на ленте.

А чем не устраивает оптика? BDR - для домашнего бэкапа вполне приемлемо, если к нему добавить какое-нибудь облачко и внешний жесткий диск, получится вполне надежно.

Тут, как я понимаю - кровавый энтерпрайз обсуждается, когда ленивым админам надо гигабайты данных каждый день бэкапить с возможностью отката на любую версию за последние 3 года. :)

Тут, как я понимаю — кровавый энтерпрайз обсуждается, когда ленивым админам надо гигабайты данных каждый день бэкапить

поправка: терабайты )

НЛО прилетело и опубликовало эту надпись здесь

Извиняюсь, попутал единицы, не успел с MFM винчестеров с их мегабайтами переключиться. :)

Для дома можно купить на Авито LTO3/4/5. LTO-5, в среднем, 20000-30000 рублей, LTO-4 тысяч за 10. Кассеты к ним (иногда попадаются даже новые в плёнке) - в среднем, 500 рублей за штуку, чистящий картридж - около 1000 рублей (которого при эксплуатации в домашних условиях хватит на долгие годы). Ну и SAS2 HBA, если его нет, тоже на вторичном рынке стоит недорого (раньше можно было купить за 1500-3000 рублей, но из-за спроса майнеров Chia стоимость подросла). Для дома таких объёмов, обычно, достаточно с запасом.
LTO-5 в режиме LTFS можно записывать прямо из "Проводника" Windows (есть драйвер и для Linux), что позволяет не заморачиваться со спец.софтом, а ещё можно использовать привод как "видеомагнитофон" - записать видеоархив и при необходимости, просматривать видео напрямую с кассеты (но лучше всё же скопировать файл на локальный диск, чтобы привод постоянно не шумел, читая очередную порцию данных).

Вот как раз давно посматриваю на такое решение. Но мучает вопрос на что обратить внимание при выборе стримера на авито. Потому как вообще не понятно на что там смотреть, и какие параметры считаются нормальными, а какие загнанной лошадью.
Не так уж важно, сколько стоит картридж, привлекательные $70 или «дорогие» $200, поскольку сами ленточные приводы стоят запредельно (>400Кр для LTO-8, а для LTO-9 не указано).
Получается, что для частника это недоступно никак, а для бизнеса опять-таки, основая стоимость — это сам привод (30 новых кассет = старый привод).
И рассчёт стоимости за гигабайт тоже неверен, т.к. не учтена стоимость привода.
И рассчёт стоимости за гигабайт тоже неверен, т.к. не учтена стоимость привода.

А для HDD стоимость сервера, куда его втыкать, тоже включена в расчет?
НЛО прилетело и опубликовало эту надпись здесь

ну полку можно и подешевле взять, а с лентами выбор не так велик.

НЛО прилетело и опубликовало эту надпись здесь
Да, например взять с гигабитными сетевыми интерфейсами, а потом мучатся с скоростью работы, а потом понять, что ещё и ssd нельзя)

ну этим как раз tier 1 балуются, а микра и прочий самосбор не капризичают )

НЛО прилетело и опубликовало эту надпись здесь

слово «самосбор» было не к месту использовано, имелись в виду полки от не tier 1 производителей, в которые можно ставить небрендированные диски (микровская уже упоминалась выше в комментариях).


хотя если хочется самосбор, то, думаю, в любой серверный корпус с активным бэкплейном можно поставить вот такой переходник и будет работать:


только сомневаюсь, что в этом есть экономический смысл )

А почему эти кассеты НАСТОЛЬКО дорогие? Неужели произвести их так трудно? Высокий процент брака? Дорогие материалы?

Ещё есть R&D.

А об этом то я и забыл… Но если я возьму, приду на завод, и уговорю директора продать кассету по цене изготовления плюс чуточку наценки, не будет же это так дорого!
Коллеги, кто работает с LTO-8, расскажите/дайте ссылок, пожалуйста, про компрессию поподробнее.
Данные — видеоматериалы в процессе/после редактирования, большие, много, понятно что не жмутся даже архиваторами на максимуме.
Консультант лоббирует закупку робота для бэкапа, уверяя, что кассета LTO-8 на 12/30 Тб будет записывать 30Тб видео, потому что «внутренняя компрессия LTO — это изменение скорости записи ленты, позволяющее вместить больше информации».
Вроде бы чушь несёт?

чушь, обычный lz-что-то-там, хотя бы статью в википедии прочитайте.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий