metrolog_ma Jan 6 2014 at 20:55

Как Роберт Моррис на 8-ми битах до 10 000 считал

3 min

36K

Programming*Java*Algorithms*

+43

Comments 51

Goodkat Jan 6 2014 at 21:10

Это что-то типа сжатия с потерями?

metrolog_ma Jan 6 2014 at 21:19

да, его как раз и применяют для сжатия звука и данных

Insty Jan 7 2014 at 16:28

А можно поподробнее о том, как это можно применять для сжатия?

metrolog_ma Jan 7 2014 at 17:41

если честно, вменяемый пример использования этого счетчика для сжатия данных я вам не приведу.

velezh Jan 6 2014 at 23:16

Что-то типа счетчика с потерями.

+23

Priest Jan 7 2014 at 13:05

Всетаки сжатие, т.к. счетчик иногда не только «теряет» но и «преобретает» =)

atrydg Jan 6 2014 at 23:20

Как Вы уложили все числа Фибоначчи в int? Первые 300 чисел.

metrolog_ma Jan 7 2014 at 00:08

я не укладывал все числа Фибоначчи — переменная counter меняет свое значение не каждый раз же, поэтому до 300-ого числа Фибоначчи не доходит
Можете запустить код и выводить номер числа Фибоначчи, когда счетчик срабатывает. поверьте там даже до 100-ого члена не доходит

metrolog_ma Jan 7 2014 at 00:09

Ели смотреть по таблице то 10946 это 21-ый член последовательности

atrydg Jan 7 2014 at 00:10

Расскажите тогда, что в итоговой табличке.

atrydg Jan 7 2014 at 00:11

Да, и почему для чисел Фибоначчи 6 765 повторяется много раз?

metrolog_ma Jan 7 2014 at 00:15

Наверное немного плохо написал что именно в таблице.
каюсь.

я запускал счетчик 10 раз с одной последовательностью и 10 раз с другой
если бы использовал обычный счетчик, то в каждой ячейке таблицы было бы значение — 10 000, так как счетчик дергался ровно 10 000 раз
но так как тут вероятностный, то значения теряют свою точность, вот я и хотел показать насколько сильный разброс у значений.

atrydg Jan 7 2014 at 00:17

Неплохо было бы добавить столбцы с финальным значением 8-битного счетчика.

metrolog_ma Jan 7 2014 at 00:19

решил его не добавлять так как на самом деле значение counter не о чем не будет говорить, но раз нужно, то добавлю))

Bazanra Jan 6 2014 at 23:32

Нельзя ли привести более корректный пример использования?
Просто в вашем примере, чтобы воспользоваться счетчиком, считающим до ~10000, мы делаем другой счетчик, который считает ровно до 10000 и не укладывается в 8 бит.

WerewolfPrankster Jan 6 2014 at 23:52

Предположим вам надо выполнить некую операцию приблизительно 10 000 000 раз, но у вас есть только 8 бит. Как только значение в счетчике будет 255, то ориентировочно она выполниться 10 000 000 раз, однако с некой погрешностью.

Поправьте, если не прав.

Imposeren Jan 7 2014 at 00:10

Подозреваю, что Bazanra недоволен тем что расчеты чисел Фиббоначи и квадратов не получится всунуть в 8 бит.

metrolog_ma Jan 7 2014 at 00:13

цикл в main — это эмуляция счетчика, в цикле происходит его срабатывание.
у вас есть всего 8 бит, но считать надо вам куда дальше 127, вот вы вместо самого значения, храните номер члена из последовательности, которую заранее выбираете.
все остальное основывается на вычислении самого значения счетчика по номеру этого члена и срабатывании счетчика с определенной вероятностью.

atrydg Jan 7 2014 at 00:25

Я вот тоже не понимаю (особенно после этого комментария), по идее этот 8-битный счетчик будет тем числом от некоего датчика (файла и т.п.). Т.е. именно его мы и будем наблюдать. В противном случае зачем такие усложнения. Но тогда возникает другой вопрос: как по этому 8-битному значению восстановить реальное значение счетчика?

metrolog_ma Jan 7 2014 at 00:35

извините, ответил на ваш комментарий не в ту ветку.

metrolog_ma Jan 7 2014 at 00:29

вызвать функцию getElementSequence с параметром counter — вернувшееся значение и будет значением самого счетчика
8-битное значение хранит только номер элемента в последовательности, в которой и находятся наши аппроксимированные значения счетчика

brdsoft Jan 7 2014 at 04:26

Не понял, с какой целью выбирается определенная последовательность? Почему нельзя просто увеличивать счетчик, например, с вероятностью 0,01? Тогда число 100 в счетчике появится примерно через 10000 итераций.

metrolog_ma Jan 7 2014 at 04:31

мы используем последовательность чтобы перемещать по ней наш счетчик, через 10 000 нам нужно что то близкое к количеству итераций. Через 10 000 нам нужно значение счетчика не 100 а желательно поближе бы к 10 000

brdsoft Jan 7 2014 at 04:41

Я имею в виду физическое значение счетчика, которое в пределах байта. Если надо сделать ~10000 итераций чего либо, имея только 8 бит, достаточно после каждой итерации увеличивать счетчик с вероятностью 0.01 и проверять, когда наш байт достигнет 100. А чтобы узнать текущее (примерное) значение реального количества итераций, просто умножить наш байт на 100. Без всяких последовательностей.

metrolog_ma Jan 7 2014 at 04:52

так у вас получается просто используется последовательность i*100, так ведь?
выбирать последовательность нужно для того чтобы управлять зависимостью точности от максимальной границы счетчика и погрешностей счетчика на разных значениях счетчика( при малых значениях и при больших)

brdsoft Jan 7 2014 at 05:12

Ага, теперь ясно

soniq Jan 7 2014 at 04:57

Последовательность выбирается такой, чтобы на всем диапазоне погрешность была «неплохой»

Например, ваш вариант (который, по сути, тоже последовательность — арифметическая прогрессия) плох тем, что на маленьких значениях очень врет: и 10 и 80 для него одно и то же, а на больших — наоборот слишком точный. Но это плохо только в общем случае, может быть такое поведение это как раз то, что нужно в конкретной задаче.

mynameco Jan 7 2014 at 04:34

Теоретически математика с плавающей точкой почти так же работает.

-2

AndersonDunai Jan 7 2014 at 08:44

Интереснейшый подход! Единственное, что тут, по моему мнению, критически необходимо — это достаточная энтропия источника RNG. А так — статья очень простая и занимательная, спасибо!

ivan4th Jan 7 2014 at 12:44

Кстати, данный Моррис — дедушка известного червя. В смысле, отец того Морриса, что этого червя написал.

relgames Jan 7 2014 at 16:27

Не понял. Если есть только 1 байт, то куда поместить методы, которые возвращают квадраты? Или числа Фиббоначи?

metrolog_ma Jan 7 2014 at 16:49

8 бит имелось ввиду, что отводится для постоянного хранения, остальное можно вычислить и хранить незачем, то есть, если у вас будет объект «счетчик», то он будет состоять из заголовка объекта и одного 8-битного счетчика.

relgames Jan 7 2014 at 17:12

Так не бывает. Ведь нужно где-то хранить код, который считает квадраты? Почему бы вместо этого кода не сохранять там счетчик? Не могу придумать практический пример, где бы этот счетчик пригодился…

chersanya Jan 7 2014 at 17:16

Ну, теоретически можно представить ситуацию (и в 70-е такое могло действительно быть), когда счётчик находится на одном устройстве с очень маленькой памятью, а «расшифровка» значения производится потом, на более мощном.

xaizek Jan 7 2014 at 17:50

Пример: устройство со сравнительно вместительной памятью только для чтения, в которой можно хранить код, но ну очень небольшой памятью с поддержкой записи для данных (или же там таких счётчиков огромное множество).

На ум приходит тот же BIOS записаный на EPROM (сейчас то они на flash-памяти) и хранение времени с питанием от батарейки, но там конечно не такие суровые ограничения по памяти.

chersanya Jan 7 2014 at 17:09

Я так понимаю, в публикации на которую вы ссылаетесь описан и теоретически проанализирован случай не любой последовательности, а только таких, где в счётчике хранится v(n)=log(1+n/a)/log(1+1/a) для некоторого a. Такой метод даёт постоянную (почти) относительную ошибку, независимо от количества событий. В связи с этим не понятно, почему вы рассматриваете последовательности i^2 (т.е. в счётчике храним sqrt(n)) и чисел Фибоначчи — для них анализа ошибки ни в той публикации, ни в вашей статье нет.

Кстати, а какие есть реальные примеры применения такого метода? Что-то в голову не приходит, куда его можно использовать, ведь сейчас нет таких проблем с памятью, как во время публикации той статьи.

metrolog_ma Jan 7 2014 at 17:22

Да, тут с вами согласен, в 80-ые годы эта проблема была более актуальна и сейчас использование такого счетчика по назначению трудно представить.

metrolog_ma Jan 7 2014 at 17:27

Выбор последовательности и их анализ это я решил не описывать в этой статье, так как и так достаточно объемной она получилась и я хотел просто показать на примере простейших последовательностей, как работает такой вид счетчиков
Если сообществу интересно то в свободное время могу подробнее рассказать о выборе последовательностей и их анализе.

23derevo Jan 7 2014 at 20:06

Хотите пример? Легко! Марсоходы, спутники. Кто угодно, у кого ограничена батарейка.
И понятно, что в общем случае речь идёт не про 8 бит, а про некоторую более сложную конструкцию, основанную на том же принципе.

Insty Jan 7 2014 at 20:21

Едва ли в столь сложной аппаратуре будут полагаться на случайности.

23derevo Jan 7 2014 at 21:04

В вопросах, в которых нужны точные вычисления — не будут. В вопросах, в которых точность не требуется, — легко. Например, выше в треде говорили про сжатие звука с потерями.

Insty Jan 7 2014 at 21:51

Возможно стоит привести конкретный пример сжатия? Даже необязательно сжатия, но желательно осовременный, а не 30-летней давности. Подход, безусловно, нестандартный, но на сегодня представляет лишь теоретический интерес.

roman_kashitsyn Jan 7 2014 at 21:32

Создавать объект Random каждый раз в increase() — не дело, его нужно создать единожды как член класса. В .net-аналоге тут, кстати, может вознукнуть проблема, т.к. там в качестве начального значения счётчика назначается значение часов невысокой точности.

metrolog_ma Jan 7 2014 at 21:37

Да. вы правы насчет единождого создания Random.

symbix Jan 8 2014 at 01:39

Если у нас так ограничены ресурсы, откуда возьмется PRNG? ;)

Разве что внешний надежный источник энтропии есть.

roman_kashitsyn Jan 9 2014 at 13:13

Мне кажется, этот метод сейчас более актуален не для 8-битных счётчиков, а для какого-нибудь uint32 для регистрации примерного числа очень частых событий (либо за очень большой промежуток времени), когда не хочется использовать медленную длинную арифметику.

roman_kashitsyn Jan 12 2014 at 12:56

В таком контексте интересно было бы посмотреть, как правильно реализовать операцию add(n).
Пример: подсчёт приблизительного числа байтов, прошедших через небольшое непрерывно работающее устройство. Добавлять байты по одному, разумеется, совершенно неприемлимо. Точное число в теории хранить не очень сложно: достаточно взять GMP и использовать два счётчика — один оперативный для быстрого сложения, другой аккумулирующий для хранения общей суммы, используемый при переполнении оперативного.

atrydg Jan 12 2014 at 13:24

Для этих целей придумали приставки кило, Мега, Гига и т.д.
Кстати, использование некоего аналога плавающей точки, но шириной в 8 бит, можно рассматривать как возможное решение поставленной проблемы.

roman_kashitsyn Jan 12 2014 at 13:41

Использовать отдельные счётчики для разных разрядов — это по сути своя узкоспециализированная реализация длинной арифметики. У поставленной проблемы много решений, мне интересно именно такое, которое относится к содержанию статьи. А именно как правильно обрабатывать операцию += n.
Про плавающую точку не понял.

brdsoft Jan 12 2014 at 15:11

А какой-нибудь uint64 позволит более 500 лет считать события с частотой 1 млрд в секунду обычным методом. Это так, для справки. А насчет add(n) интересная тема. Если в качестве последовательности выбрана арифметическая прогрессия, то думаю можно легко управлять вероятностью увеличения в зависимости от n, еще не думал как именно. С прогрессирующими последовательностями всё будет гораздо сложнее.

Colwin Jan 13 2014 at 11:53

Спасибо за идею!
Мне сразу пришла на ум мысль вычислять примерную длину получаемого XML-файла исходя из размеров уже принятых частей + глубины вложенности. Чтобы прогресс-бар пользователю рисовать. :-)
Интересно посчитать вероятность того, что примерно попадем в реальную скорость :-)

Чуть не забыл: все это при условии того, что длину передаваемого XML мы не знаем.

Show the best of all time