Sirion 16 сен 2013 в 15:55

Нормальные числа: ликбез

5 мин

58K

Математика*

+108

Комментарии 38

sulnedinfind 16 сен 2013 в 16:45

Спасибо большое, я смеялся, как ребенок, от восторга! )

burchanie 16 сен 2013 в 17:24

Ага. Если я правильно понял, по заданной последовательности чисел (в заданной системе счисления) можно построить дизъюнктивное число. А есть ли какой-то «хороший» способ это число обозначить так, чтобы этот способ не сводился к формуле

\sum_{0}^{\infty}\frac{n}{10^{n^2}}

и исходной заданной последовательности? Ну, вот число \pi все знают, его «обозначили». Может, какие-то хорошие свойства таких дизъюнктивных чисел можно автоматически выводить?

Зачем: если ответ на вопрос из предыдущего абзаца «да», то открывается прекрасная возможность троллинга патентовладельцев. Берем официальную аудио-запись в цифровой форме, определяем ее дизъюнктивное число, предъявляем претензию на отмену патента на основании «нет новизны».

dginz 16 сен 2013 в 17:28

Попробуйте www.codecogs.com/latex/eqneditor.php, а то читать некомфортно.

burchanie 16 сен 2013 в 17:31

О, спасибо — не знал о таком ресурсе. В комментарии выше формула выглядит так: $\sum_{0}^{\infty}\frac{n}{10^{n^2}}$

Sirion 16 сен 2013 в 19:35

Не до конца понял, зачем строить отдельное дизъюнктивное число для каждой записи. Достаточно взять любое дизъюнктивное число и показать, что данная запись где-то в нём находится)

burchanie 16 сен 2013 в 19:47

А что вычислительно проще? Когда я читал про pifs, у меня сложилось впечатление, что «показать, что данная запись находится в данном числе» вычислительно трудоемко. А построить новое число для заданной последовательности вроде бы попроще будет. Но возникает проблема с однозначной красивой идентификацией этого нового числа (например по дополнительным свойствам, неочевидным образом связанным с исходной последовательностью).

Sirion 16 сен 2013 в 19:50

Можно показать неконструктивно. Собственно, из строгого доказательства того, что число дизъюнктивно, уже следует, что нужный фрагмент в нём содержится. Чтобы обвинить человека, например, в краже, достаточно доказать, что он украл деньги, и нет необходимости указывать, где эти деньги сейчас находятся.

burchanie 16 сен 2013 в 20:09

как математик по образованию, я вам верю (хоть доказательства и не видел пока), что теоремы существования должно для доказательства хватить. Но согласитесь, это не тот способ, которым можно уверенно убеждать юристов и привлечь много сторонников-программистов (в некотором роде исходящих из принципа «считает — значит существует»). В общем, было бы здорово иметь технологию явного вычисления либо новых дизъюнктивных чисел (с условием из камента выше), либо бОлее вычислительно эффективного восстановления позиции последовательности в одном из известных дизъюнктивных. Зачем? Затем, что при желании тогда можно развернуть массовую кампанию по сведению официальных музыкальных/видео-треков к известным числам, с известными последствиями.

grechnik 17 сен 2013 в 13:56

Стандартный аргумент про невозможность сжатия произвольной последовательности. Если бы можно было задать любую последовательность, не используя объём данных, сравнимый с самой последовательностью, то получилось бы идеальное сжатие, которое невозможно. А если для задания нужен сравнимый объём данных — получается просто ещё один формат тех же данных.

Sirion 17 сен 2013 в 14:06

Пардон, а при чём здесь сжатие?

grechnik 17 сен 2013 в 14:12

«Ваш 700Mb файл film.avi уже существовал задолго до вас! Вот, смотрите, моя программа по 1 Gb данных выдаст ваш film.avi!»

burchanie 17 сен 2013 в 14:15

Это верно, если ждать ответов от информатики. А мой вопрос скорее к математике. Я спрашивал, возможно ли получить опосредованное описание заданного дизъюнктивного числа. Например, если вам показать 3.1415926… то вы скажете — конечно это пи! А чем пи отличается от других дизъюнктивных чисел? Во-первых его все знают :) (Что значит «знают»? Только то, что все это странное дизъюнктивное число запомнили). Но знают-то его за его свойства! Как то: длина окружности, интеграл от экспоненты -x^2 и т.п. И мой вопрос о том, можно ли аналогичные свойства выводить автоматически для новых дизъюнктивных чисел. Если да, то получив новое дизъюнктивное число, можно сказать: это не просто случайная длинная последовательность циферок, а такое специальное число, однозначно определяемое вот этим списком свойств (которые полностью определяют вашу песенку бритни спирс, а ну снимайте копирайт).

grechnik 17 сен 2013 в 14:17

Тот же самый аргумент. Если список свойств однозначно определяет произвольный 700 Мb файл, то сам список свойств должен занимать не менее 700 Мb.

burchanie 17 сен 2013 в 14:25

Вас подводит применение теоремы Шеннона, она тут ни при чем. Еще раз: я могу вам выписать бесконечное число знаков числа пи, но предъявить лишь одно свойство, однозначно определяющее это число. Свойство, дословно:

константа, иррациональное число, равное длине окружности поделенной на удвоенный радиус этой окружности.

У меня вышло 104 символа полного описания свойства, однозначно определяющего константу пи. Но число знаков у контанты в ее десятичной записи — бесконечно.

pleax 17 сен 2013 в 14:31

Тут, видимо, нужно вспомнить еще про колмогоровскую сложность.

burchanie 17 сен 2013 в 14:37

Развейте вашу мысль, плиз. А то я пока не понял, какую сторону вы поддерживаете и что именно с колмогоровской сложностью нужно делать.

pleax 17 сен 2013 в 14:43

Я это к тому, что

константа, иррациональное число, равное длине окружности поделенной на удвоенный радиус этой окружности.

фактически колмогоровская сложность числа pi.
Вы предлагаете по произвольной последовательности находить колмогоровскую сложность. Но, если я ничего не путаю, колмогоровская сложность невычислима.

burchanie 17 сен 2013 в 14:51

Заметьте, я не предлагаю, а спрашиваю: возможно ли. К тому же, у нас не произвольная последовательность, а десятичное представление дизъюнктивного числа. Это означает, что у такой последовательности могут появиться более сильные свойства, позволяющие обойти невычислимость колмогоровской сложности. Но я тут не эксперт, поэтому собственно, вопрос и задал.

grechnik 17 сен 2013 в 15:01

Вы можете задать 104 символами (не пересчитывал и можно придраться к определению, но пусть будет 104) первые 1000 цифр числа пи, но принципиально не сможете задать 104 символами произвольные 1000 цифр. Более того, если ограничиться 104 символами, то доля 1000-циферных последовательностей, которые в принципе можно задать, пренебрежимо мала (точное значение зависит от множества разрешённых цифр и символов), и все такие последовательности исключительно специальны и не имеют собственного смысла в отрыве от определения. Так что либо вам придётся создавать большие семейства свойств (типа «i-я цифра равна j»), для задания которых нужны данные, сравнимые по размеру с исходной последовательностью, либо не рассчитывать на то, что последовательности, имеющие независимый смысл, уложатся в описание.

burchanie 17 сен 2013 в 15:25

тут не произвольные последовательности, а десятичные представления дизъюнктивных чисел. Это могут быть последовательности со специальным набором свойств. Каких? В этом и был мой исходный вопрос топикстартеру.

grechnik 17 сен 2013 в 15:31

Процитирую статью:

нормальных чисел большинство. Доказано, что множество «ненормальных» чисел имеет лебегову меру 0. Это означает, что если ткнуть пальцем в единичный отрезок, то с вероятностью 100% попадёшь в нормальное число.

Нет никаких свойств, специфических для нормальных (и, тем более, дизъюнктивных) чисел и при этом отсеивающих значительные множества.

burchanie 17 сен 2013 в 15:40

Ваш аргумент выглядит разумно. No offence, но я бы хотел услышать аргументы топикстартера. Не потому что вам не доверяю, а лишь потому что он обещал некий специальный способ конструировать «число, нормальность которого очевидна». В рассуждениях «принципиально невозможно потому что ...» я не очень свободно ориентируюсь (если не специалист в теории чисел/матлогике, легко пропустить мелкие детали), проще плясать от конкретного предложения.

Sirion 17 сен 2013 в 15:53

Сконструировать число можно. А вот сконструировать для него «хорошее» описание — в общем случае нет.

iago 16 сен 2013 в 17:37

Конечно, все читают теги!

NeoCode 16 сен 2013 в 18:27

Давно хочу спросить — а что означает это «помогитеязастряловмеханизмевселенной»? Какая-то мнемоника? Если да то как она работает?

lolmaus 16 сен 2013 в 18:37

Нет, это шутка о том, как будто некий разум общается с нами, записывая послания в константы физических законов нашей вселенной.

tagir_valeev 17 сен 2013 в 09:37

Zverik 17 сен 2013 в 13:58

На случай, если не все знают этот шаблон, ссылка на TVTropes (осторожно: это ссылка на tvtropes! прочитайте статью и немедленно закрывайте вкладку, не щёлкая по ссылкам, если вам дорог ваш день!). Самый интересный вариант я встречал в 4 сезоне «Robot Chicken».

WGH 16 сен 2013 в 19:56

У меня есть ощущение, что хранение файла в виде смещения и длины в каком-то дизъюнктивном числе числе едва ли будет эффективнее, чем хранение номера файла (все возможные файлы ведь можно занумеровать). Если вообще не эквивалентно.

Sirion 16 сен 2013 в 20:00

Скорее всего, хранение номера файла будет эффективнее. Особенно если файлы занумеровать умно (более распространённым файлам — более короткие номера). Это, по идее, вообще идеальный, неулучшаемый вариант.

WGH 16 сен 2013 в 20:08

Кстати, чем-то похожая идея же применяется в арифметическом кодировании.

mekegi 17 сен 2013 в 14:36

Биекция. Ни первое ни второе ни разу не эффективнее, ибо и в том и другом случае множества равномощны. В среднем количество цифр в «смещении» или в «порядковом номере» будет равно количеству цифр исходного сообщения.

Sirion 17 сен 2013 в 14:39

Ещё длина. Вообще, утверждение не слишком очевидное.

Mrrl 17 сен 2013 в 15:03

Удивительно. Первое N-значное число впервые встретится по смещению 0, последнее — по смещению примерно 2.3*N*10^N, но в среднем по всем числам смещение их первого вхождения в нормальное число будет ровно 10^N, несмотря на повторы. Всего вдвое больше среднего значения самих чисел. Слегка неожиданно. Я думал, что будет ближе к N*10^N.