Как стать автором
Обновить

Комментарии 35

В чём преимущество ленты по сравнению с жёсткими дисками? Кроме истрической совместимости с доисторическими системами?
в целом лента более дёшева при увеличении объёмов… ну и данные на ленте шансов сохранить и прочитать больше… судя по статистике…
впрочем в статье про DAT была перепалка по этому поводу… но не уверен, что коментирующие искали ответ а не пытались показать собственное знание истины… :) ну не будем об этом.
в любом случае альтернативы ESL на дисках при сопоставимых объёмах.стоимостях я не вижу…
Сколько будут стоить 100Тб бэкапов на ленте? Сколько будут стоить 100 Тб бэкапов на 1.5Тб винтах?
опять по новой :)может не стоит?

а сколько из этих дисков прочитаются через 10 лет?
При наличии RAID — все. А сколько из лент прочитается через 10 лет при отсутствии защиты данных на них?
давайте не будем вместе смешивать надёжность носителя и способы увеличения оной :) ок? это я к вопросу про RAID
кстати контроллеры тоже дохнут иногда :)
какая надёжность у ленты? В чём она измеряется? Каким образом решается вопрос с сохранением информации при повреждении ленты?
куча методик. допустим количество ошибок чтения на гигабайт :) под рукой статистики нет но в общем случае харды хороши для локального оперативного бэкапа :)
Вот как раз на эту статистику я бы и хотел посмотреть. Потому что пока что для меня лента похожа на архаику.
Ленточная библиотека имеет значительные преимущества перед дисковым массивом по стоимости и энергопотреблению при больших объёмах хранимых данных. Например, согласно расчётам издания Clipper Notes[4], для поддержания в постоянном доступе архива размером 6,6 петабайт в течение 5 лет, стоимость дисковой системы (RAID-массивов, контроллеров, разветвителей, дисков, питания, охлаждения и пр.) составит 14,7 млн долларов (в том числе стоимость электроэнергии — 550 тыс. долларов), в то время как стоимость ленточной библиотеки — менее 700 тыс. долларов (в том числе стоимость электроэнергии — 304 доллара). Недостатком ленточной библиотеки является время произвольного доступа к данным, которое в нормальном режиме функционирования может достигать нескольких минут, а также падение производительности на порядки при увеличении количества различных одновременных запросов более количества устройств чтения-записи (когда кассеты оказываются стоящими в очереди к устройству).

ru.wikipedia.org/wiki/QIC#.D0.A2.D0.B5.D1.85.D0.BD.D0.BE.D0.BB.D0.BE.D0.B3.D0.B8.D1.8F_QIC
Давайте мы не будем в таких спорах ссылаться на Вики, ок?

Кроме того, они считали в состоянии «диски всегда онлайн». Сейчас все производители рейдов позволяют управлять spinup/spindown.
1) я с вами не спорю :) и кстати не доказываю…
2) чем вам не нравится wiki? на самом деле первое что попалось… коль вы не верите… в целом не хотел расстраивать реальностью :)
3) про «диски online» соглашусь. Однако это смахивает на «костыль» к так любимой всеми технологии бэкапа на диски :)
Вики мне не нравится тем, что там пишут все. И как АИ она не должна использоваться (это даже в правилах самой вики записано). Если мы говорим о серьёзных цифрах, то нужно смотреть на первоисточники.
Отлично, теперь есть что обсуждать.

1) Они использовали винты 750Гб размером. В условиях «экономии места» очевидным было использовать 1.5-2Тб винты.
2) Они рассматривали сценарий, когда винты непрерывно в онлайне. Для спорадического бэкапа это очевидный оверкилл.
но и лента предыдущего поколения. так что паритет есть… про онлайн — уже говорил про «костыли» на самом деле понимаю что аргументов больше нет :)
вы со своей стороны не привели ни одного аргумента…

спасибо за дискуссию.
Укор принят.

Итак, моя версия рассчёта бэкапнутого хранилища. Извините, без электричества, под руками нет нужных цифр:

Данные для хранения: 200 Пб
Диски по 2Тб массивы по формуле 30+2 (30*1.5=45Тб, 32HDD).

Нам требуется 3400 массивов, это 108800 дисков.

Далее, это всё должно где-то быть. Нам нужны

1) Хранилища: системники супермикро на 4U 36 дисков, соединяются с помощью external SAS, корзины, рейд-контроллер (256 дисков на рейд), стойки.

Имеем 108800/36=3022 корпуса, 12000 юнитов, 425 серверов и 425 рейдов.

Диски 108800 * 150 = $16.3kk:
Рейды: 425 * 700 = $300k
Супермикры: 3022 * 1600 = $5kk
Серверные потроха 425 * 1500k=$4.5kk

Итого: $26.1kk, 13 центов за гигабайт.

В цену не включено: место в серверной, стойки, коммуникации, зп персонала.
с математикой что-то не то :)
26мегадолларов не наблюдаю…

16.3+0.3+5+4.5=26.1
да, пардон, строчку пропустил, но это без электричества… а его будет нагорать огого :)
ну и — охлаждение… вобщем в целом можно понавключав powersaver mode всяких получить похожее решение по внешним параметрам… но в ленточных библиотеках то это УЖЕ ЕСТЬ. а процедура покупки и смены картриджей… сравним с заменой(и ПОИСКОМ) хардов для вашего решения?:)
Я же уже сказал — они считали в конфигурации, когда все хосты и все диски включены. В нормальной системе этого не требуется, они большую часть времени будут выключены.

Режим автовыключения задаётся в свойствах рейда и не требует никаких особых усилий по обслуживанию. И оно уже есть. Штатно.

Время поиска харда для считывания будет исчисляться микросекундами, т.к. в нормальной фс все файлы будут под рукой. А какой это винт — проблема нижележащей логики. Алсо, для тупого персонала по замене винтов будет просто мигающая красная лампочка на корзине на нужном винте.
тогад включаем время на раскрутку харда :)
ну и насладкое — стоиомсть хардов бралась без hotswap корзин :) да? в противном случае — ещё 4 винтика… но даже не это страшно… при таких объёмах есть шанс через год-два столкнуться с тем что диски нужного размера просто тупо не выпускаются… в смысле нужного ДО БАЙТА. а RAID сможет востановить только на такой :)
(опять скажете — мы будем использовать Большего размера) — и опять беда с неэффетивностью :)
Корзины входят в те полторы тысячи баксов за корпус.

А проблему «чуть-чуть отличающийся размер винта» все более-менее серьёзные рейды давно решают, резервируя небольшой кусок места в конце диска (т.е. допуская вариацию размеров заменяемых дисков).
вот тут вы ошибаетесь… возможно вам и повезло, что вы нашли такую модель… но не более того… и это, кстати неправильно с точки зрения raid-строения.
ну да не в этом дело. Я не ставил своей целью переубедить Вас… жизнь рассудит :)
Ваше желание всюду поставить диски понятно. Вам они ближе и понятнее… и альтернативную реальность вы не будете воспринимать. Вот и хорошо.
было приятно с Вами пообщаться.
Пардон, Диски по формуле 30+2, 60Тб, в остальном рассчёты такие же.
Некоторое количество. Полагаю, что для заданной ленты непрерывная эксплуатация в течение 10 лет — явно не рекомендованный режим.

Если же мы про режим «записали и забыли а через 10 лет вспомнили» — то выключеные диски прекрасно лежат. У меня (я понимаю, 15 дисков не репрезентативны) в домашней коллекции ни разу не было, чтобы дохли диски от «лежания на полочке».
безусловно если долбать 10лет картридж, то он кончится и будет печаль. но!
речь идет не о снапшотах или зеркалировании данных… про хранение на дисках… обычный диск тоже вряд ли протянет 10 лет:) но вот повреждение диска приводит к невозможности восстановления данных (как правило) — справедливо для «больших» дисков порядка 500гиг и более… проблема с позиционированием головок.
что касается ленты — смерть драйва не убийственна для данных. повреждение кассеты приводит к повреждению ЧАСТИ данных, но есть технология восстановления.хотя тут попахивает экстримом.

вобщем предлагаю закончить ломать копья: возьмите прайс.ру и посчитатйте объём пордяка 500Тб :)

п.с. уже много копий сломано :) итог — те кто админит в пределах 50серверов любят харды и верят в их непогрешимость… те кто хотя бы полгода поработал в настоящем энтерпрайзе с нормальной библиотекой — тем объяснять ненадо. :)

н.л. просто опыт :)
Я такую конструкцию бы поднял на полке с дисками в raid6 с саспендом неиспользуемых дисков. Я пока не увидел аргументов, которые бы говорили о том, что лента удобнее/лучше.
На рынке нет технологий «рободитизированных HDD библиотек». Дергать HDD через hotswap? А если выдерните не те, и не так?

К чему я это все? Диски прекрасно подходят для удаленной репликации в другой сайт, но не подходят для оффлайн хранения данных.

Если Вам нужна, прежде всего, гарантия _быстрого_ восстановления данных, то диски рулят, а если Вам нужна гарантия _восстановления_ данных (после рейда «черных масок» в оба Ваши сайта, взлома злоумышленниками Всех Ваших серверов, и порчи данных, и т д), то Ваш выбор ленты.

Если же Вам нужны обе гарантии, и есть бюджет, Вы будете коомбинировать и ленты и диски :)

З.Ы. на лентах тоже можно сделать raid-массив штатными средствами библиотеки.
З.З.Ы.
оффсайт хранение требует, конечно, курьера, но оно по дизайну именно таково: не должно быть технической возможности онлайн получить доступ к этим данным, для гарантии их сохранности.
Для сегмента SOHO — полагаю, ни в чем.
А не для сохо? Та же самая конструкция, но в рейд-массиве с выключением дисков по неактивности?
Я не спец, но могу предположить, что лента имеет смысл в тех случаях, когда нужно периодически бэкапить срез данных за определенный период, с последующим длительным хранением в архиве. В этом случае сменные картриджи использовать выгоднее, чем стационарные HDD. А оптические диски сильно сливают ленте по скорости и вместимости.
Почему «выгоднее»? Цены не покажите?
А что будет, если начало ленты повердится? Если будет потерян XML-индекс файлов картриджа, то данные потом «прямотоком» вытащить как-нибудь можно будет?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий