Pull to refresh
406
0
Send message

В далёком 97-м году друг рассказал печальную историю о полетевшем диске, в результате чего все его файлы остались "как бы на месте", но... заполнились нулями.

Поэтому, когда я написал бэкап для себя, я вставил в него простую штуку. При копировании, если основной и запасной файл заявляют себя одинаковыми, я с вероятностью, скажем, в 1% всё равно сравниваю их хэши. С тем, что если диск начнёт сыпаться, то проблема поймается эдак на сотом потерянном файле. А не на стотысячном.

И эта проверка обнаруживала иногда интересные эффекты. Например, как Винда копирует гигабайтный файл по сети? Она узнаёт его размер. Потом создаёт на "той" машине пустой файл размером в 1 гигабайт. С тем же названием и атрибутами, что и оригинал. И потом в него пишет байты. Что случится, если в этот момент сетка вдруг порвётся? Правильно. Половина файла случится.

Терял ли я сам файлы? Редко. Следите за руками:

  1. С крошечной вероятностью можно случайно ткнуть в Shift+Del, затем Enter на клавиатуре.

  2. На другой день файл стирается из бэкапа. Но его предыдущая версия там пока сохраняется.

  3. Проходит много лет.

  4. Диск для бэкапа переполняется, и я покупаю новый.

  5. На который, естественно, я пишу оригиналы файлов, а не копию копий со старого бэкапа.

  6. Из-за чего старая версия улетает в мусорку...

  7. Ещё через пару лет я спохватываюсь: вот здесь же был мой файл!

Я тут случайно тоже провёл эксперимент по измерению длительности хранения информации в сети. Дарю результаты, если нужны.

В октябре 2011-го я делал презентацию по Pink Floyd в PowerPoint. И, чтобы дать слушателям представление о материале, разместил в презентации 36 ссылок на различные композиции группы на youtube.

В января 2023-го я проверил, сколько ссылок ещё действовали. Оказалось, 18. То есть, ровно 50%. Соответственно, измеренный "период полупотери" данных в youtube составил 11.2 года.

Причины потери контента распределились следующим образом:

  • Закрытие аккаунта разместившего пользователя ("This video is no longer available because the YouTube account associated with this video has been terminated."): 7

  • Без внятной причины ("This video isn't available anymore"): 5

  • Copyright notice ("This video contains content from Pink Floyd, who has blocked it on copyright grounds" and sometimes with the specific issuer mentioned): 4

  • Нарушение каких-то правил самого ютюба ("This video has been removed for violating YouTube's policy on spam, deceptive practices, and scams"): 1

  • Видео есть, но непригодно (исчез звук:): 1

И ещё любопытное наблюдение. Как в этом, так и во во многих других исследованиях на эту тему период полупотери контента по порядку величины оказывается равен времени жизни жёсткого диска (5-10 лет).

Почему не радикально меньше, очевидно: кто станет переносить сколько-то важные данные в облако, если они оттуда испарятся через полгода? Но вот почему не намного больше? Ведь с "автоматическим бэкапом", встроенной на уровне облачной ткани защитой от вирусов, регулярно заменяемым железом время хранения должно, казалось бы, стремиться к бесконечности?

Я полагаю, оно этого не делает просто потому, что может не делать. Давление финансовое, бюрократическое в виде всяких требований, политическое, наконец, понукают облачных провайдеров выкидывать контент как можно раньше. Этому понуканию можно поддаваться, пока облачное хранение остаётся "чуть лучше" локального. Что, видимо, и продолжит оставаться точкой равновесия в определившемся будущем.

В общем, нет, не для всех, Вы правы. Для мелких переводов или в пределах какой-то группы банков может быть дешевле или бесплатно (я, когда про "независимо от суммы" заявлял, как-то не задумался про десятки-сотни). Правила бывают нетривиальны. Но для международных точно порядка 30 долларов.

Я, конечно, понимаю, что статья -- не без задней мысли вызвать побольше споров. Но всё-таки выскажусь.

1. Во многих американских банках, когда вы впервые переводите эдак от десятка тысяч новому получателю, перевод обязан быть рассмотрен и разрешён дежурным клерком на предмет законности, неотмывания и чего там ещё. Клерк ушёл домой? Ждите до завтра. Или до понедельника. Когда у меня из-за этого в первый раз чуть не сорвалось важное дело, я с матом и тоской вспоминал якобы "медленный" биткойн, где крупную сумму можно перебросить хоть на другую сторону планеты за долю часа.

2. Стоимость межбанковского перевода в наших краях -- 30 долларов, обычно независимо от суммы. Вполне сопоставимо с биткойном.

Кстати, бутылку молока никто такими банковскими переводами не покупает.

3. Высокая волатильность, без сомнения, беда. Но давайте вспомним, что крипта сегодня осталась, пожалуй, последним неинституционным массово доступным средством инвестирования. Если вы хотите поставить против "системы", вам в неё. Да, есть риск потерять 70%. Но легко показать, что если у вас есть два банка с пусть даже очень разными вероятностями потерять в них почти всё, то стратегией, максимизирующей ожидаемую сумму сохранённого капитала является вложение в оба с долями, пропорциональными взвешенным вероятностям не потерять в каждом. То есть, если вы рациональны и признаёте хоть какой-то риск за не-криповалютными инвестициями, вы просто обязаны вложить кое-что и в крипту.

4. А поскольку не я один это понимаю, то биткойн не упадёт совсем в ноль как минимум благодаря понимающим это людям.

Да, у паролей масса недостатков. Люди плохо их придумывают, плохо запоминают, легко теряют. Но у них есть одно преимущество, отсутствующее у всех прочих форм. Пароль создаётся и меняется только пользователем. Скомпрометированную биометрию сменить невозможно. А карточку и токен -- можно только с разрешения третьих лиц.

А это важно, если "стал злом" не владелец лица или руки, но владелец проверяющего его сервиса. Или чиновник, или корпорация. Пароль в этой ситуации можно сменить и уйти из-под несправедливого ограничения. Лицо или электронный "паспорт" -- нет.

Пароли на сегодня остаются последним способом доказательства своего права доступа, который контролируется самим человеком.

Гораздо интереснее вот какой вопрос: почему яркости полуденного неба и диска Луны приблизительно равны? Они ведь отличаются совсем немного. На Марсе или Венере (будь там своя Луна) подобного совпадения и близко нет.

К любой цели можно задать вопрос "а это зачем?" и получить цель следующего порядка. Вы уверены, что не проскочили какую-нибудь промежуточную точку остановки? Ибо в статье целый раздел отведён на объяснение цели "вытрезвителя".

Спасибо! Только я у них уже лет 10 как подписчик :)

«явная ложь», «явные искажения» - увы, это внешние и вполне субъективные оценки.

Нет. Не знаю, насколько Вы знакомы с тем, как работает Machine Learning, но для него они вполне объективны, и выражаются в несогласии предсказанной метки с заданным значением. В каковом случае ML будет продолжать искать увязывающую закономерность. Не найдёт он её либо если не хватит памяти (маловероятно -- людская меньше), или если зависимость полностью случайна (маловероятно -- люди очень плохие генераторы случайных чисел).

А 1984 я как бы знаком. Не забываем, что это фантастика. И фантастика слабая, полная сама себе противоречий. В мире, где не могут сделать лезвия, камеры тоже будут работать через раз.

Это, безусловно, близко связанные задачи. Но я не уверен, что задача о фильтрах проще задачи проверки на истинность. Хотя с точки зрения "продажи" её пользователю вполне может быть и проще.

Тут надо ещё думать.

Мне кажется, геббельсовский уровень лжи на неподготовленной почве не прорастёт. Люди просто выпучат глаза и покрутят пальцем у виска. А вот если их подготовить, начав с умеренных искажений.... Которые как раз и можно поймать.

Я думаю, не всё так плохо. Нам же не надо, чтобы информация или суждения человека были истинными. Нам достаточно, чтобы они в среднем не являлись случайным шумом, вот и всё. Явная ложь войдёт в решение, грубо говоря, со знаком минус. Явные искажения в человеческом суждении можно, условно, "поделить на три и сдвинуть".

[Я как-то попросил своих друзей не-химиков оценить температуры кипения пары десятков веществ, про многие из которых они и не слышали раньше. Индивидуальные оценки были жутко искажены. Собранные в кучу с помощью ML, оказались не так уж и плохи]

Единственное, когда это не будет работать -- это если входящая информация является случайным шумом (тот самый garbage). Но если работает целенаправленная пропаганда с определённой целью, она не может себе позволить совершенно случайно шуметь. Она вынуждена в какой-то степени быть преобразованной формой истины.

Что мешает сделать для начала маленький "песочный" вариант? (Собственно, я намерен попробовать)

Не думаю, что предсказание будущего вызовет хаос. Синоптики же, вон, предсказывают погоду, и ничего. Мы все, в той или иной степени, занимаемся предсказанием. Ну, повысятся точность и горизонт, вот и всё.

Главное же не предсказывать будущее, а верифицировать этим способом настоящее.

Не совсем. Ни в одной из предлагаемых архитектур ему не позволяется самому себя улучшать.

Другое дело, что кто-нибуть всё равно напишет, не для этой, так для другой цели.

Не бывает полной монополии на информацию.

Ну, понятно, борьба щита и меча будет вечной. Однако кажется же, что равновесие в ней сейчас здорово смещено в одну сторону.

По-моему, к интеллекту эта статья имеет весьма слабое отношение. Основное уравнение не обосновано хотя бы на уровне "общих соображений" (выглядит как взятое с потолка). Проекция социальных классов на IQ произвольна -- что общего между знаменитостями и крупным бизнесом? Проверка выводов весьма поверхностна.

Многофакторная аутентикация (одним из вариантов которой, если подумать, является та же проверка IP-адреса) -- это всегда внесение в систему дополнительных внешних зависимостей. По определению, потому как она должна проходить по независимому каналу.

Но чем больше зависимостей, тем выше вероятность, что какие-то из них будут использованы во зло. Не взломаны "хакерами", а именно недобронамеренно использованы самими хозяевами. Зачастую во имя самых светлых идеалов. Закрыть телефонный номер, потому что с него был разослан "запрещённый контент". Заблокировать почтовый адрес, потому что странно себя повёл. Не выслать товар, потому что заказан с непривычного айпи. Ну и т.п. И вот суммарная надёжность (с точки зрения конечного потребителя) многофакторных схем начинает падать. И будет падать, пока не сравняется с "наихудшей альтернативой", не имеющей внешних зависимостей. То есть... паролями.

У паролей, конечно, есть слабости. Труднозапоминаемые пароли люди пишут в менеджеры, что сводит безопасность схемы на нет. Легкозапоминаемые легко подбираются. НО! Вот как раз таки схема "частичного пароля", применённая к легкозапоминаемым, но длинным фразам, в значительной степени эту трудность устраняет.

Поэтому мне лично данная статья кажется крайне важной, а направление -- весьма перспективным. Не побоюсь сказать даже, в мировом масштабе.

Ведь схема <имя, пароль> -- это последнее ещё существующее средство для пользователя заявить свою "идентичность", контролируемое самим пользователем, а не Кем-То Третьим. Цифровой мир, где не осталось этого средства, будет очень страшным, управляемым лишь немногими игроками, и унылым местом. Пароли не просто рано выкидывать на свалку, за их сохранение надо бороться.

1
23 ...

Information

Rating
Does not participate
Registered
Activity