Комментарии 86
18TB HDD в розницу стоит €600 (только что в интернет-магазине проверил). Так что я не уверен, что цена тут существенно отличается от шпинделей. Выключенный шпидель тоже не потребляет электричества, а время доступа (даже с учётом spin up) значительно меньше.
Это всё не отменяет плюсов плёнки, но указывать на такие конские цены как на аргумент - спасибо, не надо.
200$ против 600$ - т.е. в 3 раза. ИМХО, разница весьма заметная, особенно когда речь пойдет на пентабайты. Да и диски придется объединять в распределенные системы минимум с 2х кратной избыточностью...
А плёнку вы предлагаете хранить в единственном экземпляре? Ух. А если шпилька застрянет, или лента на головку намотается?
С жесткими вариант «каждый день вынуть один, воткнуть другой» не получался вообще, роботов не нашли таких)))Одноплатник + переключатели — решение готово. А вообще, уже есть много готового (в том числе и для внешних дисков с USB). Например, ручное и автоматизированное.
Ну, бэкап в единственной копии всегда можно сделать. У него есть проблема - если он механически пострадал (заводской дефект, сбой в ПО читалки, перенатянувшей плёнку, аппаратный сбой читалки (муха прилипла на головку) и т.д.), то вы остаётесь без бэкапа.
В мире жёстких дисков уже давно считается неприлично что-то писать на единственное устройство. На плёнке всё ещё допускается, хотя я не понимаю, почему.
А чем это отличается от blob-хранилища с size=1 на HDD? Теряются только данные на потерявшемся диске. Однако, в мире HDD так делать считается неприлично.
А у плёнки всё хорошо?
Remove Stuck Tape From IBM LTO1 Tape Drive
https://www.youtube.com/watch?v=sLIDYg4vy8E
Соседняя статья говорит про слипание плёнки и механическую усталось пластика.
Всё бы хорошо, но за $600 с HDD вы получаете готовое решение, которое можно подключить к компьютеру и работать. А для плёнки нужен ещё привод. И вот тут как раз основная проблема для домашних бэкапов (для компаний, которые террабайтами сохраняют инфу это, понятно, выгодно).
Цены на LTO-4 (при том, что в статье речь уже о 9 версии стандарта) начинаются от 150 тыс. рублей. Возможно, б/у можно найти дешевле, но даже с учётом этого для простой домашней коллекции "фильмов / видео в 4К / фото" кажется выгоднее NAS поставить с каким-нибудь RAID 1.
Но если механика сдохнет, то оперативный ремонт или замена могут нервы потрепать. Особенно если техника вендора железки не хотят в ДЦ пускать.
Так если робот с касетами на 48 и программа бекапов прикручена к ней, то вы этот месяц легко с лент восстановите чуть ли не быстрее, чем из зашифрованных архивов бекапы будете разворачивать.
Немного не то. Вероятность, что мне понадобятся логи в течении месяца может быть высока и проще держать их на HDD. Но параллельно лить и на ленту. Если скорость заполнения ленты и частота запросов старых логов позволяют, то роботом можно назначить ответственного сотрудника. Который и кассеты поменяет и привезет нужную для восстановления по запросу. Он то дешевле робота-робота будет?
А ещё HDD покупается в комплекте со «считывателем», но стоимость гигабайта у плёнки почему то считают без его стоимости.
В цене терабайта готового хранилища. Например, для 100ПБ хранилища, вот вам математика:
8/10 erasure coding на HDD потребует 10 HDD на каждые 8 HDD данных. К каждым 36 HDD требуется экспандер, бэкплейн и external SAS кабель. К каждым 8 JBOD'ам требуется сервер с двумя 4-х портовыми SAS контроллерами. Каждые 24 сервера потребуют коммутатор. Получается, юнит (стойка с 2 юнитами хранения, 8 x 2 x 36) на 576 HDD, с 460 полезной нагрузки. С 18 ТБ дисками стойка хранит примерно 8.2ПБ данных, примерно 13 стоек вместе с hotspare юнитом (8 JBOD'ов) и коммутаторами.
Теперь его же экивалент в плёнке. Во-первых, сколько копий хранить? Erasure coding для плёнок не применим, так что, минимум, в двух копиях. Во-вторых, сколько устройств чтения и роботов для библиотек? Минимум 2, потому что иначе нет spare.
Я не знаю чей бюджет лучше сойдётся. И кто лучше масштабируется. Вот в чём выиграет плёнка - это в энергопотреблении при постоянном, но редком доступе. Если эта штука работает как холодное хранилище, куда только бэкапы пишутся, то я не знаю кто экономнее.
100ПБ хранилище, стоимость 1 ТБ. Или как эту идею ещё раз объяснить?
Большое спасибо за разъяснение. При том, что для HDD так же существуют "HDDLib" решения (у меня такое было несколько лет назад - порядка 30 HDD в специальном хранилище с возможностью подключить только 2 шт за раз, вручную), но мы рассматриваем вариант, в котором полная ёмкость хранилища доступна через сетевое API или напрямую, т.е. без визитов on-sites.
Ключевые элементы для решения на HDD я указал - SAS-контроллеры, JBOD'ы, SAS-кабели, свитч над серверами (которых не так уж и много).
Так что давайте сравнивать с решением, где каждую кассету можно адресовать программно, без биоробота.
И кто лучше масштабируется
лента интереснее в сценарии «делаем копии и никогда их не удаляем, масштабирование объёма обходится гораздо дешевле, да.
Не, лента ещё хороша в сценарии делаем копии и не трогаем до момента оборота бекапов.
я считал, у меня получалось заметно дороже, чем массив hdd
то по сути у вас 39 последовательных копий физически недоступных для, считай, всех зловредов
ИМХО проблема надумана, если не совершать явных ляпов, то вряд ли резервное хранилище станет жертвой зловредов.
хотя сейчас подумал, есть случаи, когда лента гораздо надёжнее, например, от злонамеренного админа, который при увольнении решил всё поломать, лента защитит.
В деньгах не берусь сказать, но в юнитах у меня получилось 9 стоек на дисках (за основу брал https://www.supermicro.com/en/products/chassis/4U/947/SC947HE2C-R2K05JBOD) и 1 на ленте https://buy.hpe.com/ru/ru/storage/tape-storage/tape-libraries/tape-libraries/hpe-t950-tape-library/p/1009502810, причем это еще прошлое поколение ленты, а объем уже почти в 4 раза выше обозначенного.
вот интереснее было бы и в деньгах тоже )
ещё вопрос с какой скоростью делает бекапы эта стойка с лентами? как реализовано одновременное создание бекапов из нескольких источников?
Не быстро: "Скорость передачи 388,8 Мбит/с, максимум". Скорее всего никак. Подобные решения обычно берут как 3 линию бэкапов, например когда нужно иметь консистентный бэкап за каждый день в течении лет десяти.
О, они научились 90 дисков в 4U засовывать. Я исходил из 36-38. Да, тогда ещё плотнее станет.
Полочка да, получается компактнее.
90 дисков — это Supermicro, например, причём это будет сервер с памятью и парой процессоров. К нему останется только софт и сетевые коммутаторы добрать.
Альтернатива — какой-нибудь Western Digital, которые продают полки на 102 диска. Но у них это уже простая SAS полка, к которой нужен сервер с контроллерами.
Так что 100ПБ решение с дисками получается достаточно компактным.
90 дисков — это Supermicro, например, причём это будет сервер с памятью и парой процессоров. К нему останется только софт и сетевые коммутаторы добрать.
нет, конечно же, это просто полка (jbod chassis в терминах микры).
6 рядов по 7+8 дисков, в центре ряд экспандеров, сзади блоки питания, вентиляторы и разъёмы.
хотя при большом желании материнскую плату с процессором и памятью там можно было разместить, да (БП имеет глубину почти 30 см).
https://www.supermicro.com/en/products/system/Storage/4U/SSG-640SP-E1CR90
Dual Socket P+ (LG-4189)
3rd Gen Intel® Xeon® Scalable processors
Support CPU TDP 120-205W
Memory Capacity: 16 DIMM slots
UP to 4TB: 16x 256 GB DRAM
Memory Type: 3200MHz ECC DDR4 RDIMM;LRDIMM
90x 3.5" hot-swap SATA3/SAS3 drive bays (4x 2.5" NVMe dedicated)
2x 2.5" 7mm drive bays
2 M.2 NVMe
Кстати, когда поправили насчет гига- и тера- - прикинул, а ведь емкость носителей - величина, которая больше всего выросла за 40 лет. Тактовая частота процессоров выросла с 3 МГц до 5 ГГц - на три порядка (производительность больше). Объем оперативной памяти - с 1 МБайт до сотен гигабайт - шесть порядков, скорость локальных сетей с 10 МБит до 10 Гбит - тоже три порядка.
А объем носителей - с десятков мегабайт до сотен петабайт - на 10 порядков, вот это прирост ;)
Объем оперативной памяти — с 1 МБайт до сотен гигабайт — шесть порядков, скорость локальных сетей с 10 МБит до 10 Гбит — тоже три порядка.
А объем носителей — с десятков мегабайт до сотен петабайт — на 10 порядков, вот это прирост ;)
если вы сравниваете с xt, то десятки мегабайт был единичный накопитель, сейчас топовый единичный накопитель десятки терабайт, так что прирост на 6 порядков, как и памяти.
если же говорить о серверах, то там и терабайты вполне доступы, и стагигабитная сеть. ради интереса накидал в одном компьютерном супермаркете конфиг на 2 Тб памяти, 100 Ġbps сеть и 2×6.4 TB ssd — получилось два миллиона.
Меня уже опередили и в ответ на ваш вопрос описали разумный способ сравнения комплексов, выполняющих схожие задачи. А то, что зелёное не получается сравнить с холодным, никак не оправдывает попыток это делать под предлогом «а как ещё вы их будете сравнивать?»
стабильность магнитных характеристик покрытия из феррита бария в течение более 50 лет
Непонятно только, где через 50 лет раздобыть плеер для этой кассеты.
Там в них микроконтроллеры, которые дохнут просто от времени - диффузия и броуновское движение за десятики лет убъёт транцисторы.
Ну а если там внутри что то типа пассика (тут я не знаю, только додумываю), то он за это время тоже рассыпется.
Прижимные ролики и головки — расходный материал (причём недешёвый).
Долго стоявший на складе привод нужно «оживлять» — механика же. Там смазать, там почистить и т.д. А если его специально не консервировать — так вообще может за пару лет выйти из строя (может и не выйти — по разному бывало).
Но если сильно припечёт — можно и новый сделать «на коленке». У нас так ребята восстанавливали данные. Читали и цифровали сигнал по частям, потом парсили оцифровку в нулики и единички (я им тут немного помогал). Одна кассета — почти месяц работы (без учёта создания «магнитофона»).
Ну и стримеры дохнут от километража, вроде, а не от времени.
а какого порядка ресурс?
всё-таки это задачи немного разного уровня: прочитать единичный накопитель прошлых времён и поддерживать в рабочем состоянии систему бекапов больших объёмов информации в течение десятков лет.
вторую задачу можно решить и лентами, и массивами дисков, и там, и там потребуется замена вышедшего из строя и планомерный апгрейд.
По скорости чтения/записи 400 МБ/с нативно (1000 МБ/с со сжатием) эти накопители превосходят современные HDD и SSD.
гхм, превосходят hdd и некоторые бюджетные ssd (в основном sata) и существенно проигрывают всем sas ssd и практически всем dc nvme.
плюс в массивах hdd/ssd читать/писать могут все носители одновременно, а в ленточной библиотеке всё не так.
хм, сейчас решил проверить свои прикидки, смотрю:
Стриммер HPE R1R75A
его же можно просто подключить по sas к любому серверу с hba и периодически менять кассеты?
вроде бы и бюджетно получается, сервер с 20x16ТБ HDD у нас вышел миллион, а тут в три раза дешевле можно примерно тот же объём на лентах обеспечить.
а, нет, к нему ещё нужен сам привод, что несколько увеличивает стоимость )
впрочем, появилась мысль купить внутренний привод и руками менять раз в день ленты.
Эх, когда же появится для народа современный АрВид...
Неясно, как там с обратной совместимостью.
Неясно, можно ли в теории прочитать данные без контроллера конкретного привода, то есть простая ли структура их хранения на ленте.
А чем не устраивает оптика? BDR - для домашнего бэкапа вполне приемлемо, если к нему добавить какое-нибудь облачко и внешний жесткий диск, получится вполне надежно.
Тут, как я понимаю - кровавый энтерпрайз обсуждается, когда ленивым админам надо гигабайты данных каждый день бэкапить с возможностью отката на любую версию за последние 3 года. :)
Для дома можно купить на Авито LTO3/4/5. LTO-5, в среднем, 20000-30000 рублей, LTO-4 тысяч за 10. Кассеты к ним (иногда попадаются даже новые в плёнке) - в среднем, 500 рублей за штуку, чистящий картридж - около 1000 рублей (которого при эксплуатации в домашних условиях хватит на долгие годы). Ну и SAS2 HBA, если его нет, тоже на вторичном рынке стоит недорого (раньше можно было купить за 1500-3000 рублей, но из-за спроса майнеров Chia стоимость подросла). Для дома таких объёмов, обычно, достаточно с запасом.
LTO-5 в режиме LTFS можно записывать прямо из "Проводника" Windows (есть драйвер и для Linux), что позволяет не заморачиваться со спец.софтом, а ещё можно использовать привод как "видеомагнитофон" - записать видеоархив и при необходимости, просматривать видео напрямую с кассеты (но лучше всё же скопировать файл на локальный диск, чтобы привод постоянно не шумел, читая очередную порцию данных).
Получается, что для частника это недоступно никак, а для бизнеса опять-таки, основая стоимость — это сам привод (30 новых кассет = старый привод).
И рассчёт стоимости за гигабайт тоже неверен, т.к. не учтена стоимость привода.
И рассчёт стоимости за гигабайт тоже неверен, т.к. не учтена стоимость привода.
А для HDD стоимость сервера, куда его втыкать, тоже включена в расчет?
ну полку можно и подешевле взять, а с лентами выбор не так велик.
Да, например взять с гигабитными сетевыми интерфейсами, а потом мучатся с скоростью работы, а потом понять, что ещё и ssd нельзя)
ну этим как раз tier 1 балуются, а микра и прочий самосбор не капризичают )
слово «самосбор» было не к месту использовано, имелись в виду полки от не tier 1 производителей, в которые можно ставить небрендированные диски (микровская уже упоминалась выше в комментариях).
хотя если хочется самосбор, то, думаю, в любой серверный корпус с активным бэкплейном можно поставить вот такой переходник и будет работать:
только сомневаюсь, что в этом есть экономический смысл )
Данные — видеоматериалы в процессе/после редактирования, большие, много, понятно что не жмутся даже архиваторами на максимуме.
Консультант лоббирует закупку робота для бэкапа, уверяя, что кассета LTO-8 на 12/30 Тб будет записывать 30Тб видео, потому что «внутренняя компрессия LTO — это изменение скорости записи ленты, позволяющее вместить больше информации».
Вроде бы чушь несёт?
В продажу поступили плёночные кассеты на 18 терабайт