honyaki 9 мая 2022 в 23:36

Как я случайно удалил 7 терабайт видео перед запуском в продакшн

6 мин

12K

Блог компании SkillfactoryPython*Программирование*IT-инфраструктура*Интерфейсы*

Перевод

Комментарии 17

datacompboy 10 мая 2022 в 00:57

Так вот что с rutube приключилось!

+37

IvaYan 15 мая 2022 в 20:43

Когда увидел заголовок, решил что речь как раз о RuTube. Видимо, не я один так решил.

dragndroper 10 мая 2022 в 01:03

Как по мне, это уж слишком умный и хитрый джуниор.

randomsimplenumber 10 мая 2022 в 07:22

Джуниор - это про отсутствие опыта, а не ума.

Просто звёзды неудачно сошлись. Провайдер видеохостинга со своими джунами в поддержке + автор, решивший запилить одноразовый велосипед all-in-one.

BugM 10 мая 2022 в 04:09

20тб диск стоит тысячу долларов. Берем два делаем raid1, надежно! Итого две тысячи долларов. Диски останутся в вашем сервере до следующего такого же случая. Они прослужат годы.

20тб в облаке Амазона стоит 500 долларов за месяц. Месяца всяко хватит на все эксперименты, пока все успешно не перенесется.

О чем вообще речь? Зарплата джуна с налогами и офисом за месяц выходит больше чем надежное место чтобы эти данные положить временно для экспериментов.

Не экономьте на спичках. При любом переносе данные в начале кладем в надежное и простое место, и только потом экспериментируем как переложить туда куда надо. Нервы или тем более потерянные данные выйдут гораздо дороже чем любое адекватное хранилище для них.

censor2005 10 мая 2022 в 08:29

Я так понимаю, данные у них хранились в надёжном месте, а проблема была с автоматизацией загрузки и скоростью передачи

BugM 10 мая 2022 в 14:05

А тогда зачем суетится и волноваться? Не получилось - снесли и перелили ещё раз. Более правильно. Передача 20тб по сети не стоит почти ничего.

zgen 11 мая 2022 в 05:54

Стоит время, и много, когда его уже нет

censor2005 11 мая 2022 в 07:06

В статье пишется, что нужно было загрузить 8Тб на скорости 30Мбит. Это порядка 600 часов, или 24 дня. Даже на скорости 100Мбит ушло бы 7 дней. В итоге, как я понял, загрузили напрямую с Google Диска, о чём собственно и написана статья.

v1000 10 мая 2022 в 10:02

Берем два делаем raid1, надежно

я тоже так думал, только вот из-за бага в биосе через месяц все данные на диске превратились в кашу. понятно что не надо сравнивать десктоп и сервер, но все же.

DreamShaded 10 мая 2022 в 11:01

давно было? Просто когда денег на raid стало хватать, ни разу таких проблем ни на десктопах, ни на серверах не встречал

НЛО прилетело и опубликовало эту надпись здесь

DaneSoul 10 мая 2022 в 12:28

ИМХО, основная проблема показанного подхода в осуществлении опасных операций (удаления) сразу при проходе по страницам.
Я бы делал в три этапа:
1) Собирал два списка с id видео с обеих сервисов
2) Сравнивал два списка, заодно проверив их реальное содержимое и количество элементов
3) И уже только имея готовый сформированный список id на удаление запускал по нему саму процедуру удаления.

DjPhoeniX 10 мая 2022 в 15:38

Вот кстати да, это было первое что я заметил в скрипте. Причём каждый запуск он бы перекачивал всё заново. Гораздо логичнее выкачать данные (первый кэш), обработать собрав список «действий» (второй кэш), и запустить действия на выполнение. Тогда при сбое на третьем этапе не придётся заново выполнять предыдущие. Ну и результат валидировать поэтапно (вручную при необходимости).

mayorovp 10 мая 2022 в 16:01

Я сильно привык к React и почему-то думал, что url обновится, как только изменится page. Конечно, это не так.

На всякий случай напоминаю, что в React никакой url бы не обновился автоматически тоже.

Maksclub 10 мая 2022 в 18:04

и правда какой-то бред... как url обновится? :)

ладно если в page лежит какой-то обсервабл, и на изменение его меняется url, но код иначе бы выглядел... я сейчас не про реакт, конечно — сама суть, реактивная природа просто так в коде не появляется... она выражена кучей сущностей фреймворка :)

Maksclub 10 мая 2022 в 18:12

Поставщик громких историй: школа SkillFactory :)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий