Comments / Profile of eugeneb0 / Habr

User

ProfileArticles18PostsNewsComments346

Цифровой вытрезвитель. Решение

eugeneb0 Feb 27 at 18:06

Проблемы тех, кто не заинтересован в объективной истине, меня мало волнуют. Их массовость всего лишь означает, что мы с друзьями больше выиграем, вычислив её раньше и воспользовавшись этим знанием.

"Да, и чтобы два раза не вставать - голосование не выявляет истины." -- я мог бы попросить доказать это расхожее утверждение. Но не буду, потому что предложенный метод достаточно далёк от "обычного" голосования, чтобы это было важно.

+2

Составляем из четырёх двоек любое целое число

eugeneb0 Feb 27 at 08:11

Если допустимы гиперболические функции, то любое целое число можно сделать из любого другого целого. Даже одного.

Вспомним, что Ch^2(x) - Sh^2(x) = 1

Из чего следует, что Ch(ArcSh(x)) = √(1+x^2)

Заменив x = √k, получаем

Ch(ArcSh(√k)) = √(k+1)

Применяя это соотношение нужное число раз, можно любое k превратить в k+1. Например:

3 = Ch(ArcSh(Ch(ArcSh(Ch(ArcSh(Ch(ArcSh(Ch(ArcSh(2))))))))))

Обратная операция -- понижение на единичку -- достигается через Sh(ArcCh(√k)) = √(k-1)

+1

Цифровой вытрезвитель. Решение

eugeneb0 Feb 27 at 06:44

Любопытно. Ознакомлюсь. Спасибо!

+2

Цифровой вытрезвитель. Решение

eugeneb0 Feb 27 at 06:43

Ну да, динамический хаос (как и ряд других задач) крайне плохо поддаётся предсказанию. Но далеко не все задачи принадлежат к этому классу.

В полной документации ещё сказано:

"Это не панацея. Метод никогда не сможет найти ответ, если информация о нём не присутствует во входных данных хотя бы в фрагментарном виде. Он всего лишь позволяет участникам, мысля совместно, находить более точное решение, нежели мысля по отдельности. Само решение всё равно может оказаться донельзя паршивым." Собственно, нам бОльшего и не надо.

+3

Цифровой вытрезвитель. Решение

eugeneb0 Feb 27 at 06:30

Любые реальные данные в той или иной степени неполны. Однако вызванная этим ошибка не всегда бесконечна.

У любой предсказательной системы есть процент ошибок. Вон, длину доски и ту нельзя измерить с абсолютной точностью. Но это же не повод отказываться от изготовления табуреток :)

+1

1 апреля — о серьёзном: факапы бэкапов

eugeneb0 Apr 3 2024 at 03:31

В далёком 97-м году друг рассказал печальную историю о полетевшем диске, в результате чего все его файлы остались "как бы на месте", но... заполнились нулями.

Поэтому, когда я написал бэкап для себя, я вставил в него простую штуку. При копировании, если основной и запасной файл заявляют себя одинаковыми, я с вероятностью, скажем, в 1% всё равно сравниваю их хэши. С тем, что если диск начнёт сыпаться, то проблема поймается эдак на сотом потерянном файле. А не на стотысячном.

И эта проверка обнаруживала иногда интересные эффекты. Например, как Винда копирует гигабайтный файл по сети? Она узнаёт его размер. Потом создаёт на "той" машине пустой файл размером в 1 гигабайт. С тем же названием и атрибутами, что и оригинал. И потом в него пишет байты. Что случится, если в этот момент сетка вдруг порвётся? Правильно. Половина файла случится.

Терял ли я сам файлы? Редко. Следите за руками:

С крошечной вероятностью можно случайно ткнуть в Shift+Del, затем Enter на клавиатуре.
На другой день файл стирается из бэкапа. Но его предыдущая версия там пока сохраняется.
Проходит много лет.
Диск для бэкапа переполняется, и я покупаю новый.
На который, естественно, я пишу оригиналы файлов, а не копию копий со старого бэкапа.
Из-за чего старая версия улетает в мусорку...
Ещё через пару лет я спохватываюсь: вот здесь же был мой файл!

+2

Фотохостинги с 2017 по 2023 (утрачено 57% фотографий)

eugeneb0 Nov 25 2023 at 03:35

Я тут случайно тоже провёл эксперимент по измерению длительности хранения информации в сети. Дарю результаты, если нужны.

В октябре 2011-го я делал презентацию по Pink Floyd в PowerPoint. И, чтобы дать слушателям представление о материале, разместил в презентации 36 ссылок на различные композиции группы на youtube.

В января 2023-го я проверил, сколько ссылок ещё действовали. Оказалось, 18. То есть, ровно 50%. Соответственно, измеренный "период полупотери" данных в youtube составил 11.2 года.

Причины потери контента распределились следующим образом:

Закрытие аккаунта разместившего пользователя ("This video is no longer available because the YouTube account associated with this video has been terminated."): 7
Без внятной причины ("This video isn't available anymore"): 5
Copyright notice ("This video contains content from Pink Floyd, who has blocked it on copyright grounds" and sometimes with the specific issuer mentioned): 4
Нарушение каких-то правил самого ютюба ("This video has been removed for violating YouTube's policy on spam, deceptive practices, and scams"): 1
Видео есть, но непригодно (исчез звук:): 1

И ещё любопытное наблюдение. Как в этом, так и во во многих других исследованиях на эту тему период полупотери контента по порядку величины оказывается равен времени жизни жёсткого диска (5-10 лет).

Почему не радикально меньше, очевидно: кто станет переносить сколько-то важные данные в облако, если они оттуда испарятся через полгода? Но вот почему не намного больше? Ведь с "автоматическим бэкапом", встроенной на уровне облачной ткани защитой от вирусов, регулярно заменяемым железом время хранения должно, казалось бы, стремиться к бесконечности?

Я полагаю, оно этого не делает просто потому, что может не делать. Давление финансовое, бюрократическое в виде всяких требований, политическое, наконец, понукают облачных провайдеров выкидывать контент как можно раньше. Этому понуканию можно поддаваться, пока облачное хранение остаётся "чуть лучше" локального. Что, видимо, и продолжит оставаться точкой равновесия в определившемся будущем.

+4

Мы сами себя обманули с Биткоином

eugeneb0 Sep 2 2023 at 00:05

В общем, нет, не для всех, Вы правы. Для мелких переводов или в пределах какой-то группы банков может быть дешевле или бесплатно (я, когда про "независимо от суммы" заявлял, как-то не задумался про десятки-сотни). Правила бывают нетривиальны. Но для международных точно порядка 30 долларов.

0

Мы сами себя обманули с Биткоином

eugeneb0 Sep 1 2023 at 07:00

Я, конечно, понимаю, что статья -- не без задней мысли вызвать побольше споров. Но всё-таки выскажусь.

1. Во многих американских банках, когда вы впервые переводите эдак от десятка тысяч новому получателю, перевод обязан быть рассмотрен и разрешён дежурным клерком на предмет законности, неотмывания и чего там ещё. Клерк ушёл домой? Ждите до завтра. Или до понедельника. Когда у меня из-за этого в первый раз чуть не сорвалось важное дело, я с матом и тоской вспоминал якобы "медленный" биткойн, где крупную сумму можно перебросить хоть на другую сторону планеты за долю часа.

2. Стоимость межбанковского перевода в наших краях -- 30 долларов, обычно независимо от суммы. Вполне сопоставимо с биткойном.

Кстати, бутылку молока никто такими банковскими переводами не покупает.

3. Высокая волатильность, без сомнения, беда. Но давайте вспомним, что крипта сегодня осталась, пожалуй, последним неинституционным массово доступным средством инвестирования. Если вы хотите поставить против "системы", вам в неё. Да, есть риск потерять 70%. Но легко показать, что если у вас есть два банка с пусть даже очень разными вероятностями потерять в них почти всё, то стратегией, максимизирующей ожидаемую сумму сохранённого капитала является вложение в оба с долями, пропорциональными взвешенным вероятностям не потерять в каждом. То есть, если вы рациональны и признаёте хоть какой-то риск за не-криповалютными инвестициями, вы просто обязаны вложить кое-что и в крипту.

4. А поскольку не я один это понимаю, то биткойн не упадёт совсем в ноль как минимум благодаря понимающим это людям.

+2

История развития паролей и средств их хранения

eugeneb0 Jan 18 2023 at 07:52

Да, у паролей масса недостатков. Люди плохо их придумывают, плохо запоминают, легко теряют. Но у них есть одно преимущество, отсутствующее у всех прочих форм. Пароль создаётся и меняется только пользователем. Скомпрометированную биометрию сменить невозможно. А карточку и токен -- можно только с разрешения третьих лиц.

А это важно, если "стал злом" не владелец лица или руки, но владелец проверяющего его сервиса. Или чиновник, или корпорация. Пароль в этой ситуации можно сменить и уйти из-под несправедливого ограничения. Лицо или электронный "паспорт" -- нет.

Пароли на сегодня остаются последним способом доказательства своего права доступа, который контролируется самим человеком.

+1

Видна ли Луна днем?

eugeneb0 Jun 12 2022 at 05:45

Гораздо интереснее вот какой вопрос: почему яркости полуденного неба и диска Луны приблизительно равны? Они ведь отличаются совсем немного. На Марсе или Венере (будь там своя Луна) подобного совпадения и близко нет.

0

Цифровой вытрезвитель

eugeneb0 Mar 31 2022 at 23:11

К любой цели можно задать вопрос "а это зачем?" и получить цель следующего порядка. Вы уверены, что не проскочили какую-нибудь промежуточную точку остановки? Ибо в статье целый раздел отведён на объяснение цели "вытрезвителя".

0

Цифровой вытрезвитель

eugeneb0 Mar 31 2022 at 23:06

Спасибо! Только я у них уже лет 10 как подписчик :)

0

Цифровой вытрезвитель

eugeneb0 Mar 9 2022 at 04:26

«явная ложь», «явные искажения» - увы, это внешние и вполне субъективные оценки.

Нет. Не знаю, насколько Вы знакомы с тем, как работает Machine Learning, но для него они вполне объективны, и выражаются в несогласии предсказанной метки с заданным значением. В каковом случае ML будет продолжать искать увязывающую закономерность. Не найдёт он её либо если не хватит памяти (маловероятно -- людская меньше), или если зависимость полностью случайна (маловероятно -- люди очень плохие генераторы случайных чисел).

А 1984 я как бы знаком. Не забываем, что это фантастика. И фантастика слабая, полная сама себе противоречий. В мире, где не могут сделать лезвия, камеры тоже будут работать через раз.

0

Цифровой вытрезвитель

eugeneb0 Mar 9 2022 at 02:51

Это, безусловно, близко связанные задачи. Но я не уверен, что задача о фильтрах проще задачи проверки на истинность. Хотя с точки зрения "продажи" её пользователю вполне может быть и проще.

Тут надо ещё думать.

0

Цифровой вытрезвитель

eugeneb0 Mar 8 2022 at 18:59

Мне кажется, геббельсовский уровень лжи на неподготовленной почве не прорастёт. Люди просто выпучат глаза и покрутят пальцем у виска. А вот если их подготовить, начав с умеренных искажений.... Которые как раз и можно поймать.

+1

Цифровой вытрезвитель

eugeneb0 Mar 8 2022 at 18:29

Я думаю, не всё так плохо. Нам же не надо, чтобы информация или суждения человека были истинными. Нам достаточно, чтобы они в среднем не являлись случайным шумом, вот и всё. Явная ложь войдёт в решение, грубо говоря, со знаком минус. Явные искажения в человеческом суждении можно, условно, "поделить на три и сдвинуть".

[Я как-то попросил своих друзей не-химиков оценить температуры кипения пары десятков веществ, про многие из которых они и не слышали раньше. Индивидуальные оценки были жутко искажены. Собранные в кучу с помощью ML, оказались не так уж и плохи]

Единственное, когда это не будет работать -- это если входящая информация является случайным шумом (тот самый garbage). Но если работает целенаправленная пропаганда с определённой целью, она не может себе позволить совершенно случайно шуметь. Она вынуждена в какой-то степени быть преобразованной формой истины.

0

Цифровой вытрезвитель

eugeneb0 Mar 8 2022 at 16:08

Что мешает сделать для начала маленький "песочный" вариант? (Собственно, я намерен попробовать)

+1

Цифровой вытрезвитель

eugeneb0 Mar 8 2022 at 16:07

Не думаю, что предсказание будущего вызовет хаос. Синоптики же, вон, предсказывают погоду, и ничего. Мы все, в той или иной степени, занимаемся предсказанием. Ну, повысятся точность и горизонт, вот и всё.

Главное же не предсказывать будущее, а верифицировать этим способом настоящее.

+1

Цифровой вытрезвитель

eugeneb0 Mar 8 2022 at 15:55

Не совсем. Ни в одной из предлагаемых архитектур ему не позволяется самому себя улучшать.

Другое дело, что кто-нибуть всё равно напишет, не для этой, так для другой цели.

0

1

2 3 ...