Как стать автором
Обновить

План аварийного восстановления — уверенность в завтрашнем дне для всей компании и спокойный сон ИТ-отдела

Блог компании КРОК

Знакомая ситуация?

Есть такая штука – непрерывность бизнеcа. Эта сфера уже достаточно развита и подразумевает, что ваш бизнес может продолжить работу без происшествий даже после попадания метеорита в дата-центр или офис.

Интересно, что сейчас в России успешное внедрение планов аварийного восстановления бизнеса обладает побочным эффектом в виде быстрого карьерного роста предложившего и внедрившего.
Читать дальше →
Всего голосов 36: ↑33 и ↓3 +30
Просмотры 48K
Комментарии 27

Как готовить бизнес к чрезвычайной ситуации с IT

Блог компании КРОК
В топике — основные действия по обеспечению непрерывности бизнеса, которые дают базовый результат. Эти действия помогут избежать катастрофы, выполнить аварийное восстановление и выйти из ситуации с минимальными потерями.

Напоминаю, руководство внедрением — задача очень ценимая руководством, и, почти всегда в России, ведущая к карьерному росту.

Читать дальше →
Всего голосов 53: ↑37 и ↓16 +21
Просмотры 27K
Комментарии 8

Катастрофоустойчивые IT-системы: как внедрить в своей компании

Блог компании КРОК
Представьте, что ваш дата-центр (или боевой сервер) сегодня упал. Просто взял и упал. Как показывает практика, готовы к этому далеко не все:

  • 93% компаний, которые теряли свой ЦОД на 10 и более дней из-за катастрофы, стали банкротами в течение года (National Archives & Records Administration in Washington)
  • Каждую неделю в США выходит из строя 140 000 жестких дисков (Mozy Online Backup)
  • У 75% компаний нет решений для аварийного восстановления (Forrester Research, Inc.)
  • 34% компаний не тестируют резервные копии.
  • 77% тех, кто тестируют, обнаруживали нечитаемые накопители в своих библиотеках.

В предыдущих постах (раз и два) я писал про организационные меры, которые ускорят и облегчат восстановление ИТ-систем и связанных с ними процессов компании при чрезвычайной ситуации.



Сейчас поговорим про технические решения, которые в этом помогут. Их стоимость разнится от нескольких тысяч до сотен тысяч долларов.
Читать дальше →
Всего голосов 22: ↑17 и ↓5 +12
Просмотры 49K
Комментарии 17

Резервная площадка в облаке с использованием vSphere Replication

Блог компании CloudMTS
Резервная площадка в облаке

Для подавляющего большинства компаний наличие двух или более собственных площадок все еще остается непозволительной роскошью. И что же делать с обеспечением непрерывности оказания ИТ-сервисов в такой ситуации? Вывод очевиден: если по каким-то причинам нет возможности использовать публичное облако в качестве основной площадки – его можно успешно использовать в качестве резервной!

Читать дальше →
Всего голосов 15: ↑9 и ↓6 +3
Просмотры 14K
Комментарии 8

Беспечное отношение к данным: сколько стоит ваш бэкап?

Блог компании Acronis
Привет, хабр. Ответьте себе на один простой вопрос: давно ли вы в последний раз делали резервную копию данных своего компьютера? На Хабре, конечно, отношение “забэкапленных” пользователей и “незабэкапленных” чуть отличается от среднего по миру (в лучшую, разумеется, сторону), но всё равно показатель далёк даже от 50%. Так что вопрос “давно ли вы делали бэкап”, скорее, риторический: хорошо если встроенные в ОС средства восстановления после сбоев были настроены и занимались каким-то своим резервным копированием, полный бэкап всех критических, чувствительных или просто важных данных делают всё ещё очень и очень редко. И это при копеечной стоимости (и внушительных объёмах) современных жёстких дисков.

Image #2073660, 70.1 KB

Почему пользователи беспечно относятся к своим данным? Ответ, на самом деле, простой:
Читать дальше →
Всего голосов 44: ↑28 и ↓16 +12
Просмотры 28K
Комментарии 76

Планирование аварийного восстановления. Часть первая

Системное администрирование *

Определяем места, где стоит подстелить соломку




Отказы в работе информационных систем – события, которые невозможно исключить полностью. Вне зависимости от причин случившегося сбоя, в момент его возникновения на системного администратора ложится груз ответственности по оперативному восстановлению работоспособности не только ИТ-систем, но и бизнеса в целом.

В цикле из трех коротких статей я постараюсь доступно описать процесс формирования плана аварийного восстановления, который позволяет перевести задачи по восстановлению работоспособности систем в разряд заранее согласованных с руководством мероприятий, имеющих свой график, ресурсы и бюджет.

В первой статье речь пойдет об определении зоны планирования, или поиске тех инфраструктурных элементов, отказ в работе которых негативно влияет на частоту пульса системного администратора. Итак, по порядку:
Читать дальше →
Всего голосов 20: ↑18 и ↓2 +16
Просмотры 42K
Комментарии 32

Планирование аварийного восстановления. Вторая часть

Системное администрирование *

Готовимся к любым падениям




Это продолжение цикла публикаций, посвященных вопросам планирования аварийного восстановления. В предыдущей статье речь шла об определении зоны планирования и нахождении точек отказа, которые могут приводить к сбоям в работе пользовательских сервисов. Следующий шаг – опираясь на информацию о точках отказа определить минимально возможные сроки устранения инцидентов, которые могут обеспечить технические специалисты при наличии всех необходимых ресурсов.

Собственно, необходимые ресурсы будут в дальнейшем предметом торга с руководством компании, помогая найти баланс между инвестициями в информационные технологии, временем простоя и потерей данных в случае сбоя. Но это потом, а пока нам нужно определить какие сроки восстановления мы в принципе можем выжать из ИТ-инфраструктуры в случае сбоя. Поехали:
Читать дальше →
Всего голосов 16: ↑15 и ↓1 +14
Просмотры 28K
Комментарии 11

Планирование аварийного восстановления. Часть третья — заключительная

Системное администрирование *IT-инфраструктура *

Соотносим потребности бизнеса с его возможностями




В предыдущих статьях (1,2), посвященных вопросам планирования аварийного восстановления, были описаны процедуры сбора и обработки информации об ИТ-инфраструктуре организации, позволяющие получить точную информацию о:

  • ИТ-сервисах, критичных для бизнеса компании,
  • Текущем времени восстановления их работы в случае сбоя,
  • Минимально достижимых сроках аварийного восстановления,
  • Необходимых ресурсах для их достижения.

И все бы ничего, если бы не ограниченные финансовые возможности организации, не позволяющие приобрести все необходимые резервы для оперативного восстановления. По этой причине заключительная задача планирования аварийного восстановления – поиск баланса между потребностями и финансовыми возможностями бизнеса, и закрепление его в виде соглашения об уровне обслуживания (Service Level Agreement – SLA) в части устранения возникающих инцидентов.

Данный этап полностью состоит из согласования с руководством компании следующих аспектов взаимодействия:
Читать дальше →
Всего голосов 24: ↑21 и ↓3 +18
Просмотры 17K
Комментарии 0

Фривольное клонирование ОС MS Windows XP / Server 2003 своими руками, средствами GNU/Linux

Системное администрирование **nix *
Из песочницы

Объяснительная записка


Публикую журналированный результат работы по обеспечению себя универсальным живучим образом установленной операционной системы (далее ОС) Windows XP SP3.

Он понадобился для ускорения процесса установки системы на компьютеры клиентов, пожелавших непременно пользоваться этой привычной версией окошек вопреки разглагольствованиям относительно поддержки, активации и прочих маловажных юзеру моментов.

Почему это нужно?



Что отличает данный материал от распространенных статей на тему клонирования ОС? Ограничения, поставленные передо мною жизнью и самим собой. Перечислю их:

1) ОС должна устанавливаться и работать на разделах произвольных размеров;
2) ОС должна исправно загружаться, будучи установленной на любой тип носителя, поддерживающий загрузку (оснащенный MBR*);
3) ОС должна функционировать на различных вариантах аппаратно-зависимого уровня (HAL**);
4) Образ ОС должен занимать минимум места на носителе для ускорения его переноса, дооснащения, переборки;
5) Образ ОС должен включать в себя необходимый набор установленного и настроенного лучшим образом ПО (вариант «система под ключ»);
6) Все манипуляции по приготовлению образа и по его развертке должны производиться штатными средствами GNU/Linux***. Смысл: разобрать по косточкам принцип работы имеющегося ПО для клонирования ОС;
7) Носителем образа ОС может быть сервер в сети, USB-накопитель (твердотельный либо винчестер), оптический или жесткий магнитный диск;
8) Носитель образа ОС должен быть оснащен средствами диагностики и ремонта ПО компьютера;
9) Желательно процесс клонирования ОС сделать максимально доступным ради хорошей повторяемости без урезания надежности результата;
10) Команда dd, безусловно, хороша, вот только неохота возиться с пустым пространством, нулями и отсутствием четкого вывода текущего действия. Кроме того, раздел, в который будет установлен клон, должен быть произвольным (см. п. 1).

Вне рассмотрения:

1) Юридические моменты установки неподдерживаемой ныне ОС;
2) Активация неактивируемой ныне официально ОС;
3) Целесообразность производимых действий. Не задротствакрасноглазия ради, но токмо волею пославших меня юзеров. Пославших за попытку убедить в кошерности использования свежего свободно-распространяемого программного обеспечения на их дуболомных машинах;
4) Подробности типовой установки ОС Windows XP и доп. ПО на компьютер, за исключением разбивки диска;
5) Подробности метода сетевого клонирования: рассмотрю в дальнейшем, сейчас такой нужды не имею.

Кому это нужно?

Работа ориентирована на удовлетворение запросов конечных пользователей. Статья написана для системных администраторов, желающих перенять приобретенный мною опыт и знания и воспользоваться нижеописанным способом. Отсюда подробности, которые могут не понравится торопливым людям. Объем текста, на мой взгляд, чудовищный для легкого восприятия, но я иначе не могу: надо донести каждый мой шаг.

Конструктивная критика приветствуется; особенно ценны предложения по совершенствованию способа, а также теория, обосновывающая замечания.

Дата написания статьи — 2 декабря 2014 года, посему будущим поколениям шлю свой привет, а насколько сохранится актуальность материала для вас — не ведаю.

Добро пожаловать, %username%, под отрезок.
Читать дальше →
Всего голосов 43: ↑28 и ↓15 +13
Просмотры 27K
Комментарии 24

Обеспечение доступности данных и сервисов: показатели RPO, RTO и планирование SLA

Блог компании Veeam Software Системное администрирование *Восстановление данных *Резервное копирование *
Сегодня я постараюсь разъяснить, что такое концепция доступности данных с точки зрения ИТ-специалиста, будь то ИТ-администратор, системный интегратор, консультант по внедрению и т.д. Надеюсь, что эта статья будет полезна читателям при составлении экономического обоснования на внедрение соответствующих программных и\или аппаратных решений, а также соглашений об уровне обслуживания (SLA) – а кому-то поможет сделать эти документы более убедительными.
Для начала в качестве «узелков на память» сформулирую два постулата, с которыми многие, уверен, довольно хорошо знакомы:

  • RPO (recovery point objective) – допустимая потеря данных. Любая информационная система должна обеспечивать (внутренними ли средствами, или сторонними) защиту своих данных от потери выше приемлемого уровня.

  • RTO (recovery time objective) – допустимое время восстановления данных Любая информационная система должна обеспечивать (внутренними ли средствами, или сторонними) возможность восстановления своей работы в приемлемый срок.

Часто эта пара показателей отображается в виде одномерного графика вдоль оси времени.
Но в таком одномерном графике нет самого главного, на что ориентируется бизнес – денег! О том, как рассчитывать RTO и RPO, исходя из требований бизнеса, я расскажу под катом.

Читать дальше →
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 39K
Комментарии 1

Уменьшаем время простоя Zimbra при аварии на сервере с помощью Zextras Backup

Блог компании Zextras Резервное копирование *
Не ломается и не падает только то, что уже сломалось и лежит. Это золотое правило знает каждый ИТ-менеджер, и именно поэтому наличие систем резервного копирования и экстренного восстановления в любом современном ИТ-решении стало индустриальным стандартом. Это не только позволяет избежать потери важной информации, но также минимизировать время простоя предприятия вследствие различных аварий и нештатных ситуаций.

image
Читать дальше →
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 2.6K
Комментарии 6

Даже пожар не помеха, или Скоростное восстановление Zimbra после катастрофы

Блог компании Zextras
В прошлой статье читатели просили нас рассказать подробнее о том, как происходит восстановление работы Zimbra после выхода из строя серверного оборудования или даже его физического уничтожения. Поэтому сейчас мы расскажем о том, как происходит данный процесс и поделимся рядом приемов, благодаря которым весь процесс будет занимать у вас несколько минут.

image
Читать дальше →
Всего голосов 9: ↑7 и ↓2 +5
Просмотры 2.1K
Комментарии 4

Аэростаты Loon обеспечивают аварийное подключение к сети и интернет в Перу после землетрясения магнитудой — 8,0

Блог компании ua-hosting.company IT-инфраструктура *Разработка систем связи *Стандарты связи Сотовая связь
Как вы уже знаете (с предыдущей статьи), компания Loon уделяет особое внимание обеспечению связи по всему миру с помощью атмосферных шаров. Полезная во время стихийных бедствий, компания Alphabet вновь продемонстрировала универсальность своего подхода, быстро обеспечив LTE связь после землетрясения магнитудой 8,0 в Перу, когда все хотели знать о состоянии и благополучии своих близких.



26 мая 2019 года сильное землетрясение обрушилось на отдаленный регион Перу — Амазонку. Благодаря существующему коммерческому тестированию и работе с Telefónica по обеспечению доступа к мобильному интернету в районах с недостаточным уровнем доступности, компания Loon смогла обеспечить связь в течение 48 часов.

В воскресенье утром в регионе произошло землетрясение магнитудой 8,0. По просьбе правительства Перу и Tefónica мы быстро перенаправили группу воздушных шаров в пострадавшую зону. Ранним утром во вторник прибыли первые воздушные шары и начали обслуживать LTE пользователей, находящихся внизу. Скоро прибудет еще больше шаров.
Читать дальше →
Всего голосов 26: ↑26 и ↓0 +26
Просмотры 4.8K
Комментарии 6

Сервис для Active Restore или история одного индустриального проекта в Иннополисе

Блог компании Acronis Резервное копирование *Разработка под Windows *
Привет, Хабр! Меня зовут Роман, и я хочу рассказать сегодня о том, как мы в университете Иннополис разрабатывали тестовый стенд и сервис для системы Acronis Active Restore, которая скоро должна стать частью продуктовой линейки компании. Всех, кому интересно, как строятся взаимоотношения университета с индустриальными партнерами, приглашаю проследовать под кат.

image
Читать дальше →
Всего голосов 31: ↑29 и ↓2 +27
Просмотры 2K
Комментарии 0

Disaster Recovery и миграция c помощью VMware vCloud Availability. Часть 2

Блог компании DataLine IT-инфраструктура *Виртуализация *Облачные вычисления *Облачные сервисы
Привет! В прошлом посте я рассказал о возможностях VMware vCloud Availability (vCAV) и показал, как организовать Disaster Recovery (DR) и миграцию в рамках нескольких площадок облачного провайдера. Сегодня посмотрим, как с помощью vCAV восстановиться или просто смигрировать в облако сервис-провайдера с on-premise-площадки. В нашем примере будем настраивать DR с локальной площадки заказчика в облако в СПб. 



На этапе подготовки нужно решить, как обеспечить доступ к серверам после их восстановления в облаке. Для этого нужно организовать сетевую связность между локальной площадкой и облаком. Об основных способах подключения к облаку я писал здесь.

Для удобства сделал быструю навигацию по инструкции:


Читать дальше →
Всего голосов 13: ↑13 и ↓0 +13
Просмотры 1.9K
Комментарии 1

Резервирование и аварийное восстановление с помощью Zextras Backup

Блог компании Zextras Системное администрирование *Сетевые технологии *Резервное копирование *
Одной из главных задач, которая встает перед системным администратором при внедрении любой информационной системы — обеспечение сохранности хранящихся в ней данных. Наиболее оптимальным способом добиться этой цели является резервирование, которое позволяет при минимальных затратах всегда иметь на руках инструменты для восстановления работоспособности системы даже в случае достаточно масштабного сбоя.

Наиболее продвинутым инструментом резервирования для Zimbra OSE на сегодняшний день является Zextras Backup, входящий в состав решения Zextras Suite Pro и Zextras Suite Basic. В нем реализовано транзакционное резервирование, которое в реальном времени отслеживает каждое происходящее в Zimbra OSE изменение и резервирует все транзакции. Благодаря этому в резервной копии помимо самих данных сохраняется история их изменений и при восстановлении информации из резервной копии можно воссоздать любой почтовый ящик, любой домен или даже почтовый сервер такими, какими они были на определенный момент времени.

image
Читать дальше →
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 1.8K
Комментарии 0

Гиперконвергентная инфраструктура, для периферийных вычислений, часть 4

Блог компании Hewlett Packard Enterprise IT-инфраструктура *Резервное копирование *Хранение данных *
Перевод

Cегодня разберем, как функции отказоустойчивости данных HPE SimpliVity, включая локальное и удаленное резервное копирование, влияют на определение целевой точки восстановления (RPO) и целевого времени восстановления (RTO), помогая предотвратить потерю данных в случае аварии.

Гиперконвергентные инфраструктуры продолжают набирать популярность, поскольку организации стремятся упростить ИТ-инфраструктуру, особенно в для периферийных вычислений. Удаленные офисы и филиалы, как правило, не располагают достаточным пространством для размещения ИТ-инфраструктуры, но нуждаются в защите данных не меньше, чем центральный ЦОД. Такие предприятия, как жилищное управление Metropolitan Thames Valley и страховая компания King Price, занимающаяся онлайн страхованием, развернули HPE SimpliVity в первую очередь для того, чтобы избежать простоев и обеспечить восстановление данных в случае стихийного бедствия или подобного инцидента, который может привести к потере данных.

Но как именно работает защита данных?

В HPE SimpliVity реализована система локального и удаленного резервного копирования, без дополнительных затрат на лицензирование; эта возможность входит в состав решения. Резервное копирование ориентировано на виртуальные машины (ВМ), т. е. вам не нужно восстанавливать весь том, чтобы добраться до конкретной ВМ. Функция восстановления на уровне файлов в HPE SimpliVity позволяет восстановить конкретную ВМ или даже отдельные файлы или папки внутри ВМ. Благодаря системе виртуализации данных HPE SimpliVity создание резервных копий ВМ выполняется практически мгновенно. Так как никакие данные не перемещаются, а только создается копия метаданных с указателями на исходные блоки. В результате чего, можно добиться огромной экономии пространства при хранении большого числа резервных копий, при этом сведя к минимуму необходимость использования отдельных инструментов для резервного копирования.

Читать далее
Рейтинг 0
Просмотры 744
Комментарии 0