BarsMonster18 мая 2013 в 10:50

Игра Жизнь и преобразование Фурье

5 мин

63K

Математика * Ненормальное программирование * Программирование *

+64

Комментарии 76

qw1 18 мая 2013 в 11:31

Было бы очень ценно показать «на пальцах».
Взять маленькую игровую матрицу (4x4 достаточно), показать её ПФ, показать результат умножения и результат обратного преобразования.

Каждый бы смог повторить в матлабе.

BarsMonster 18 мая 2013 в 11:42

Хорошая идея, матрицы сейчас сделаю. Вот только скрипты для матлаба предлагаю написать специалистам по матлабу.
Я же из C++ получу промежуточные изображения.

SADKO 18 мая 2013 в 12:13

Матлаб фтопку, даёшь православный сионизмъ!
(кроме шуток, примеры на матлабе уже задрали)

qw1 18 мая 2013 в 12:16

Скрипт не важен. Нужны тестовые данные. Чтобы человек, далёкий от c++, хотящий повторить это в своём любимом maple/python/подставить-нужное, мог на каждом шаге видеть, правильно он двигается или сделал ошибку.

megalol 18 мая 2013 в 15:37

Скрипт на матлабе не содержал бы ничего, кроме идеи. Вам, видимо, нравится продираться сквозь malloc'и и макросы

BarsMonster 18 мая 2013 в 13:14

Промежуточные изображения добавил в пост.

qw1 18 мая 2013 в 14:02

Спасибо.

У меня было предположение, что можно двигать эволюцию простым умножением без обратного преобразования на каждом шаге, и только после N шагов снять результат.
С примером я понял, что после каждого шага нужно применять пороговые фильтры, которые обнулят клетки с большими суммами и с маленькими, что невозможно сделать, оставаясь в спектральном представлении.

НЛО прилетело и опубликовало эту надпись здесь

Exileum 18 мая 2013 в 11:45

powdertoy.co.uk/ — в этой «игре» симуляция «жизни» аналогичным образом сделана.

savask 18 мая 2013 в 12:39

Насколько я знаю, в The Powder Toy используется обычный подсчёт соседей. Может быть Golly использует БПФ как один из вариантов, хотя там вроде Hashlife главный алгоритм.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 13:24

все и так знают.

В этом месте по-подробнее. Все это кто? Все 292 тыс. пользователей хабра? :-)

Те, кто хорошо учился в университете на мат./физ. факультете — да, крайне вероятно знают.
Я например не знал, пока не разобрался с этим алгоритмом.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 13:31

У вас логическая ошибка

Те кто не прогуливал && вообще имел в расписании курс математического анализа.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 13:51

Не вполне согласен. Если «почувствовать» как работает БПФ, его можно применять, не вникая до самого дна внутренностей.

В этом и состоит разница между программированием как ремеслом, и программированием как искусством :-D
Зачастую нужно именно ремесло.

НЛО прилетело и опубликовало эту надпись здесь

sergof 18 мая 2013 в 16:18

Поддерживаю вашего оппонента — после прочтения вашей заметки стало таки интересно, но вовсе не стало понятно. Надо ширше наверное. Спасибо

BarsMonster 18 мая 2013 в 16:57

Думаю, подробный рассказ о том, как работает и реализовывается БПФ и какие у него свойства — может стать хорошей темой для отдельной статьи, но не в моем исполнении. Я не чувствую, что смог бы рассказать об этом понятно.

krovatti 19 мая 2013 в 06:29

Попробуйте осилить кто-нибудь, пожалуйста. Мне лично очень интересно, но данных по теме не хватает однозначно.

P.S. гуманитарий же )

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 18:53

Что такое «полный смысл»? ДПФ двухточечной последовательности состоит из суммы и разности ее элементов (с точностью до нормирующего множителя); ДПФ одноточечной последовательности совпадает с ней самой. Никто смысла не теряет.

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 19:06

Вы знаете, терминологию не просто так люди придумали, а чтобы было более-менее понятно то, что говорят другие. Я вот этой фигней занимаюсь, сколько себя помню, но, уж извините, у Вас не понял ни одного слова. Что такое «спектральное поле»? Что такое «0 точка»? Дальше тоже непонятно. Не бывает никакой действующей частоты. Бывает действующее значение.

По существу: при любом количестве точек, начиная с одной, ДПФ сохраняет свой смысл, включая физическую интерпретацию амплитудного и фазового спектров.

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 19:44

Мне кажется, что физикам и электронщикам как раз легче понимать смысл спектральных методов, чем математикам и программистам. Это же просто набор полосовых фильтров, не более того. Правда фильтры так хитро подобраны, что их частотные характеристики в сумме дают тождественную единицу, поэтому по их откликам можно восстановить исходный сигнал.

А понимать отдельно смысл ДПФ/БПФ по-моему и не нужно, потому что это просто схемы вычисления настоящего (интегрального) спектра. Причем БПФ вообще является на самом деле очень хитрой эксплуатацией идеи факторизации матрицы, реализующей ДПФ.

Про всю эту Фурьевскую магию написано очень много и есть книжки, где все очень хорошо разжевано (та же книжка Сато). Мне кажется, что вряд ли стоит все это повторно разжевывать на Хабре. А вот про приложения я собираюсь пару статей написать — про тот же Шазам и про передискретизацию картинок. А томография — очень специфичная тема и там само БПФ не так уж и важно на самом деле, ведь первые томографы вообще не обрабатывали получаемые картинки, а использовали аппаратно реализованное т.н. обратное проецирование и спектральные методы просто позволили улучшить качество картинки.

НЛО прилетело и опубликовало эту надпись здесь

kaichou 20 мая 2013 в 06:49

Это совсем не первый курс математического анализа.
Первый курс — это пределы и производные.
Преобразование Фурье — в лучшем случае четвёртый семестр.

mayorovp 20 мая 2013 в 10:40

Третий семестр это, второй курс соответственно. По крайней мере, у меня было так.

ltwood 18 мая 2013 в 12:22

может давать хорошую скорость для плотно заполненных полей, и быстро уходит в отрыв с ростом сложности правил и площади/объема суммирования

Но для классических правил оно все же будет заметно медленнее работать, чем прямое вычисление. В основном за счет большой константы перед N² log N и за счет худшей локальности при обращении к памяти.

BarsMonster 18 мая 2013 в 12:30

В среднем да, если конечно не брать в расчет варианты вроде «код на Python использует библиотеку на GPU/многопроцессорной системе».

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 18:57

Нет, имено N² log₂ N. Посмотрите где-нибудь в книжке. Подсказка: в изображении размером N x N пикселов N², так что за N log² N их все даже просуммировать не получится.

ltwood 18 мая 2013 в 19:02

Не рассмотерл у Вас слов «для одномерного». Но для одномерного оценка тоже другая — N log₂ N.

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 19:13

Совсем я запутался, извините. Мне почему-то сначала показалась, что у Вас цифирька 2 вверху стоит, тогда как должна внизу. А оказывается, она у Вас посередине :) Сорри.

НЛО прилетело и опубликовало эту надпись здесь

kitaisc 18 мая 2013 в 13:31

Вот тут я понимаю Жизнь, даже музыка соответствующая www.youtube.com/watch?feature=player_detailpage&v=C2vgICfQawE

chersanya 18 мая 2013 в 13:36

Хотелось бы ещё сравнения скорости с наивным алгоритмом, хотя бы простейшего — чтобы вообще представлять насколько это реально быстрее/медленнее на разных количествах суммируемых элементов. А вообще, конечно, БПФ отличная вещь, столько применений что многие даже в голову не приходят, как например этот, или там поиск подстрок какой-нибудь.

BarsMonster 18 мая 2013 в 14:09

Да, думаю было бы полезно, вечером проведу замеры.

НЛО прилетело и опубликовало эту надпись здесь

chersanya 18 мая 2013 в 19:13

Это всё конечно хорошо, только речь о другом. В статье сравнивается на словах алгоритм с БПФ и наивный алгоритм для игры «Жизнь», без ДПФ. Вот о их скорости и вопрос.

Кстати, вы как-то странно противопоставляете ДПФ и БПФ, хотя БПФ — один из алгоритмов для вычисления ДПФ.

НЛО прилетело и опубликовало эту надпись здесь

chersanya 18 мая 2013 в 19:39

У БПФ в данном случае асимптотика O(N^2 log N), а у наивного алгоритма — O(N^2), поэтому асимптотически соотношение как раз не в пользу первого, но тут N не такие большие и было бы интересно сравнить реальное время. Вы, видимо, не совсем поняли что с чем сравнивается. Кстати, основание логарифма тут вообще не важно, ни в статье ни в комментариях здесь мы всё равно мультипликативные константы не пишем (а логарифмы по разным основаниям как раз на такие константы отличаются).

НЛО прилетело и опубликовало эту надпись здесь

chersanya 18 мая 2013 в 20:19

«здесь мы всё равно мультипликативные константы не пишем (а логарифмы по разным основаниям как раз на такие константы отличаются»
— вот тут я не понял…

Мультипликативная константа — такая, на которую умножается (ну или делится :) ) Так как log_a n = log₂n / log₂a, то в асимптотиках и не пишут обычно основание логарифма, также как и константы (я имею в виду, что не пишут например что количество операций в алгоритме равно 7*n, а пишут что O(n)).

«поэтому асимптотически соотношение как раз не в пользу первого, но тут N не такие большие и было бы интересно сравнить реальное время. Вы, видимо, не совсем поняли что с чем сравнивается.»
вы хотели что сравнить?
1.однобитный целочисленный алгоритм суммирования окружения клетки и БПФ на двойной точности?
2.Асимптота логарифма затормаживается, а N в квадрате — растёт как взрыв. Вы наверное перепутали. С ростом N — БПФ выигрывает всё сильнее…

Запишите асимптотики для БПФ в данном применении и для этого однобитового (хотя это не важно конечно) алгоритма, и увидите (n^2 log n против n^2).

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 20:51

Замеры скорости проведены, результаты в конце статьи.

chersanya 18 мая 2013 в 21:00

Как по мне, так хорошие результаты. Думал, БПФ хуже себя покажет.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 13:49

Согласен, добавил это :-)

YUVladimir 18 мая 2013 в 17:43

А как обстоят дела с точностью БПФ и ошибками округления — не было проблем с этим?

BarsMonster 18 мая 2013 в 17:48

Суммы округляются до ближайшего целого при проверках. Из-за того, что результаты БПФ напрямую в следующих итерациях не используются — ошибки не накапливаются.

Проблем не было, что не удивительно — приведенный пример вообще нагло считает все в double. Но думаю, было бы все хорошо и с single, и с фиксированной точкой.

YUVladimir 18 мая 2013 в 18:00

Единственный минус БПФ — потребление памяти при таком подходе очень большое. Примерно в 64-128 раз больше по сравнении с битовым (или двухбитовым) представлением поля. Это может стать существенным минусом при больших размерах.

НЛО прилетело и опубликовало эту надпись здесь

chersanya 18 мая 2013 в 20:22

Вы что именно имеете в виду? В данном случае не столь важно, как в процессоре это считается, а сколько занимает массив из этих вещественных чисел. А он как раз занимает в 32 или 64 раза больше, чем одно- или двухбитовый.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 мая 2013 в 22:23

Так сопроцессор в классическом виде — медленно но верно уходит в прошлое.
На x87 инструкциях быстрый FFT не написать.

Современный математический код использует SSEx инструкции — и разрядность вещественных чисел не больше 64.
80 бит вещественные числа — остались только для совместимости, и очень медленны по сравнению с SSEx.

НЛО прилетело и опубликовало эту надпись здесь

YUVladimir 18 мая 2013 в 18:14

ИМХО, библиотека FFTW заоптимизирована вдоль и поперек — одна из лучших по производительности. Ничего существенно быстрее написать не получится

ltwood 18 мая 2013 в 19:01

Только если заранее для всех размеров входных массивов создать и сохранить профили. Если же считать без профиля, то она почти не обгоняет стандартную реализацию FFT (которая без использования преобразования Уолша).

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 20:21

FFTW оптимизирует схему вычислений в алгоритме FFT с учетом конфигурации кэшей конкретного процессора. Если простыми словами, то он решает, до какого размера еще стоит разбивать последовательность на две (из четных и нечетных элементов) и потом сливать их спектры, а начиная с какого размера можно использовать прямое вычисление (на самом деле там все чуть сложнее). Эта оптимизация проводится для каждой длины исходной последовательности путем выполнения неких бенчмарков на конкретной машине и результаты сохраняются в файл профиля. Потом этот профиль можно использовать при вычислении БПФ.

НЛО прилетело и опубликовало эту надпись здесь

ltwood 18 мая 2013 в 20:53

Это скорее всего размер, при котором данные перестают целиком помещаться в кэш процессора.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 19 мая 2013 в 05:18

Сравниваем скорость работы с «наивной» реализацией

А если сравнить с HashLife?

BarsMonster 19 мая 2013 в 07:08

HashLife — он бесспорно адски быстрый.

НЛО прилетело и опубликовало эту надпись здесь

VorontsovIE 19 мая 2013 в 06:44

Спасибо за статью. Как-то раньше не приходил в голову очевидный факт, что клеточные автоматы — это просто свёртка.

qw1 19 мая 2013 в 12:36

Это комбинация свёртки и дискретной (пороговой) функции.
Второй шаг не позволяет применить классический (непрерывный) мат. аппарат для анализа или прогнозирования.
Стивен Вольфрам доказал неприводимость клеточного автомата к более простой модели.

dtestyk 3 ноя 2015 в 03:25

Прошу прощения за некропост

дискретной (пороговой) функции… не позволяет применить классический (непрерывный) мат. аппарат для анализа или прогнозирования

А почему нельзя применить какой-нибудь сигмоид?

mayorovp 3 ноя 2015 в 03:42

Сигмоид даст лишь приближенное решение — которое обязательно разойдется с исходным через некоторое число итераций.

Кроме того, в непрерывном случае также существуют такие стабильные «решения» как поле, заполненное одинаковыми клетками со значением примерно 1/4. Ценность этих решений применительно к исходной игре «Жизнь» — сомнительна.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий