Pull to refresh

Comments 42

Хотелось бы больше подробностей.

Ведь для осуществления такой задумки, надо чтобы был какой-то внешний интерпретатор «для очень сложного бесконечного набора данных» и уместные ребята (в плане интерпретирования, т.е. они должны быть намеренно написаны под интерпретатор) которые «эти данные изнутри преобразовывали».

Просто вакханалия какая-то получается отчасти. Трудно представить такое.

По сути это будет какой-то дикий оптимизатор данных, способный свести все эти данные к более простым выражениям, но по прежнему уместных для интерпретатора. Причем оптимизатор будет запущен в том же пространстве данных и он должен быть намеренно создан под такую задачу.

А мы созданы под такую задачу? Надо подумать.
Не в плане способности оптимизировать, а в плане «мы созданы вообще или все же мы случайное творение эволюции в рамках законов интерпретатора»?

Внешний интерпретатор — это собственно приложенный к архиву скрипт. Он же наверное оптимизатор, если я правильно понял что вы имеете ввиду.
По поводу нас. Возможно этого никто никогда не узнает :)

А почему нет? Вдруг вся бесконечность сводится к циклу (повторяемые фрагменты)? Тогда можно будет бесконечность описать конечным образом (с некоторой вероятностью — уверенностью).
UFO just landed and posted this here
А такой вариант?
Вполне себе бесконечная последовательность и записана конечно прямо в комментарии.

while(true) {
   print("123")
}
Не пойдёт, потому что чтобы такое написать — надо быть уверенным, что последовательность именно повторяет одни и те же фрагменты бесконечно, а как же это понять, не считав её полностью, а как же её считать, если она бесконечна.
Последовательность не может иметь бесконечную энтропию, если ее каким-то образом можно представить в конечном мире. Задача сводится, таким образом, к выяснению способа представить эту последовательность в виде конечного алгоритма, порождающего ее.
Вот я Вам представляю в конечном виде круг: О
Напишите-ка мне алгоритм, выводящий полностью отношение длины его окружности к радиусу.

Поясните свою мысль пожалуйста.

Подождите, насколько я понимаю, из «бесконечного набора данных» никак нельзя получить конечный набор. Иначе — это не бесконечный, а просто очень большой набор данных.

Вот вам пример. В прямоугольной двумерной системе координат бесконечный набор данных находящийся на линии проходящей через ноль и отклоненной от оси Х на 45 градусов можно сжать до трех символов "X=Y".

Если набор не истинно случайный — описание закономерности может быть сколь угодно сложным, но всё же конечным.
Т.е., по сути, все сводится к поиску некой функции для описания этих данных? Что-то сдается мне, подобная задача для произвольных данных выглядит как-то не очень решаемой.

Речь шла не про произвольный набор, а про "очень сложный бесконечный набор данных" с приемлемым уровнем энтропии :)

Думаю можно сказать, что "произвольный набор данных" в определении содержит невозможность компрессии. Хотя тут само понятие поизвольности несколько размыто. А, в свою очередь, бесконечный набор данных вполне может сжиматься — вот пример

Нет, я немного не про это.
Вот смотрите. Если мы можем подобным образом описать наш набор данных — значит задача решена.
Но, на вход нам могут поступать _любые_ данные, иначе наш архиватор предназначен только для сжатия, условно говоря, прямых линий и окружностей.
И даже в этом случае идем далее — если этот набор любых данных бесконечен, нам нужно как-то уметь определять, что мы можем сжать, а что нет. Но как решить эту задачу на бесконечных данных?

Достаточно научиться путешествовать по всему объему данных :) Например вы легко можете попасть в любую точку на функции x=y и убедиться в работоспособности такого описания функции. Чем сложнее набор данных, тем сложнее задача описания его в математическом виде. Задача трех тел, например, до сих пор не решена в общем случае.

Ну т.е. в общем случае сабжевая задача не решаема (в данный момент), а в частном случае нам нужно определить этот самый частный случай, что сводит решение проблемы к общему случаю. Я правильно понял? :)

Более того, на данный момент считается, что ее даже теоретически нельзя решить. Но это на данный момент )

Задача стояла сжать _конкретную_ последовательность, насколько я понял
видимо тем, что он намеренно сгенерирован и точно не абсолютно случайно
Как насчет чисел Фибоначчи? Набор данных бесконечен, но описать его можно одной строкой. Я так понял, в рассказе описывается что-то похожее, хоть и значительно сложнее
Смотрите тред далее.
Если мы абсолютно точно уверены, что данная последовательность подчиняется какой-то закономерности — то тут вопросов нет. Вся фишка тут в том, чтобы определить, есть ли закономерность в бесконечном наборе данных.
Задание было нелегким. Надо было написать архиватор для очень сложного бесконечного набора данных, который необходимо сохранить в конечном объеме.

Если набор данных — это псевдослучайная последовательность, то выполнив свёртку можно представить её в виде вполне себе конечного объёма полинома для генерации М последовательности. Подозреваю, что ученик исследовал отклики от прогона данных через корелляторы =)

Вопрос еще в том, что само определение случайности/псевдослучайности фактически лежит в области можем мы сжать это или нет. Если можем — это псевдослучайный набор, если нет — случайный. Для нас, здесь и сейчас. Имхо любой случайный набор данных имеет вероятность стать в будущем псевдослучайным.

В принципе, справедливо и обратное — набор считающийся псевдослучайным на какой-то итерации может стать случайным, когда «заработает» какой-то коэффициент полинома. Т.е. если реализовать длинный-предлинный сдвиговый регистр ПСП с небольшим количеством обратных связей для большущего полинома, то какой-то коэффициент свой вклад может начинать вносить спустя большое время после запуска процесса.
Но от этого последовательность не станет истинно случайной. Просто выяснится, что у нее более длинный период повторения и задающий полином.
А разве можно 10ю цифрами написать абсолютно, т.е. даже участками, неповторяющуюся бесеонечную последовательность?
Самое простое, мне кажется, все четные обозначить как А а нечетные как Б-и сразу появяться закономерности и последовательности, а потом разобраться ниже уровнями…
Извините если протупил, я не метематик вовсе…

Думаю, что дело в том, что повторение "участками" не считается. Если вы взяли 10 цифр, то как минимум эти 10 цифр будут постоянно повторяться. А можно ли из этого сделать случайную бесконечную последовательность? Вот, пожалуйста 3,14159265… и т.д.

Вот! это то, что я не могу понять --учасками повторение не считается, а бесконечность мы не можем посчитать по определению… вы тут логического несоответствия не видите?:-)
А по поводу пи, имхо-если из десятичной системы массив перевести в бинарную и рассмотреть просто как массив нулей и единиц, мне думается там участками будет достаточно закономерностей, а уж как частные закономерности экстраполировать на бесконечность не знаю, думаю что нельзя будет предсказать конкретное число, но можно будет достаточно точно(с определенной вероятностью) описать некий выделенный участок.понятно, что никакого практического смысла в этом нет, но его и глупо искать (имхо) когда речь идет о бесконечности… как говорилось в одном произведении:«бесконечное познание требует бесконечного времени, а потому работай или нет результат одинаков» :-)

Может я не до конца вас понял, но нет, я не вижу тут противоречия. Бесконечное познание требует бесконечного времени, но познание некоторых бесконечностей не требует бесконечного познания и вполне делается за конечное время.

Тут нужен архиватор Бабушкина который превратит бесконечное количество данных в пару килобайт.
что-то знают об архивации создатели .kkrigger и .debris
Fix: .kkrieger. Ну и да, упаковщик у них назывался .kkrunchy, а то, что привели вы, — игра и демка.
На правах литературного критика. )))
Двухчастная форма — это хорошо.
1. Второй абзац хотелось бы более подробным — а то много осталось за кадром. Собственно связь обитателей мира и программиста. Читатель догадывается… но… как-то непонятно.
2. Не надо использовать «как бы». Это означает «я не могу найти точную фразу, поэтому пусть читатель придумает её за меня».
Ждем еще!!!

Большое спасибо за комментарий и критику. По поводу "как-бы", тут оно означает что-то вроде "на самом деле все сильно сложнее, но вы можете представить себе, что скрипт как-бы изучает данные изнутри". Если этого эффекта не получилось, то я бы тоже с удовольствием от него избавился. Есть идеи чем его заменить?
По поводу "за кадром". Хм… В общем то так и задумывалось :) Собственно связь обитателей мира и программиста и надо додумать. Иначе вся интрига потеряется :)

Никогда еще искусственный интеллект не называли скриптом.:)

Забавно, что тогда я под скриптом имел ввиду "людей". Но сейчас видно, что ИИ подходит лучше.

Sign up to leave a comment.

Articles