Сегодня мы разберем профильную тему на основе кейса Google Tech Talks, которым поделился один из инженеров компании, а тематических журнал High Scalability проанализировал рассказ ИТ-специалиста Google.
/ Фото Windell Oskay / CC
На основе видеозаписи выступления и поста эксперта мы составили чеклист:
/ Фото Windell Oskay / CC
На основе видеозаписи выступления и поста эксперта мы составили чеклист:
- От простоты организации бэкапа зависит скорость восстановления данных
- Хранение данных нельзя масштабировать линейно — больше дисков и сотрудников — это не решение — нужна автоматизация
- Для достижения необходимого уровня доступности данных необходимо диверсифицировать точки отказа
- Стабильную работу систем восстановления данных может обеспечить только постоянное тестирование
- От простоты организации бэкапа зависит скорость восстановления данных
- Хранение данных нельзя масштабировать линейно — больше дисков и сотрудников — это не решение — нужна автоматизация
- Для достижения необходимого уровня доступности данных необходимо диверсифицировать точки отказа, но избыточность сама по себе не гарантирует работу без каких-либо потерь данных и сбоев
- Основная причина проблем — ошибки на уровне служебных систем, а не какие-либо неисправности, вызванные погодными условиями. Стабильную работу систем восстановления данных может обеспечить только постоянное тестирование ПО
- Так или иначе, забывать о воздействии на физическом уровне не нужно — здесь стоит рассмотреть RAID-технологии (например, Google использует GFS — аналог RAID), которые позволяют работать с географически распределенной системой хранения данных
- Копирование на магнитную ленту — хорошая альтернатива для бэкапа и действующий способ повысить уровень диверсификации (этот инструмент используют и в Google)
- Мониторинг ситуации помогает определить уровень потенциальной проблемы и адекватно реагировать. Иногда следует исключить человеческий фактор из процесс восстановления
- Эффективность системы хранения данных зависит от вашей готовности идти на компромисс и учитывать целый ряд факторов, в том числе и экономических
- При восстановлении данных важно обратить внимание на то, как они используются — возможно имеет смысл начать с восстановления данных текущих клиентов, которые наиболее активно работают с системой
- С ростом вашей компании и по мере добавления новых продуктов растет не только капитализации компании, но и уровень ответственности перед клиентами