SmartEngines Jan 28 at 13:39

Фильтр Гаусса на стероидах: секреты ускорения вычислений

Medium

8 min

5.8K

Smart Engines corporate blogMathematics * Image processing *

+35

Comments 27

Sdima1357 Jan 28 at 16:33

1. В такой статье обойтись без упоминания https://en.m.wikipedia.org/wiki/Central_limit_theorem ? Повторная свертка прямоугольников (бегущее среднее) очень быстро сходится к гауссиану.

Когда ошибка 10^-6, картинки показывать не нужно, они одинаковые

Refridgerator Jan 29 at 06:59

Делал такой трюк для полосового фильтра с линейной ФЧХ - 4 скользящих средних с пропорциями 5,6,7,8 дают подавление боковых лепестков в 65 дБ. 6, 7, 8, 9, 10 - 80 дБ.

adeshere Jan 28 at 20:25

Глянул на годы выхода публикаций. Для меня это просто шок-контент ;-) Я был уверен, что все это придумано и описано лет на 50 раньше. Мы у себя в программе используем подобные трюки где-то с 1989г, когда у нас встал вопрос о скорости вычислений. Нам тогда и в голову не приходило, что в этом может быть какая-то новизна.. Единственное существенное отличие - у нас в сигналах присутствует много Nan-значений, которые приходится обрабатывать особо. Из-за них алгоритмы получаются совсем не такими красивыми, как у классиков :-( Ну и еще у нас временные ряды, то есть задачка во всех случаях исключительно одномерная.

Sdima1357 Jan 28 at 22:43

Нет тут особой новизны. У меня тоже лет 20 назад были примерно такие же результаты как в статье( для feature detection DOG и похожих ) но на заметно более слабых компьютерах. Точные цифры не помню, надо посмотреть реализацию и замеры для точных цифр, но было быстрее чем open cv раз в пять Тут важно правильно заботиться о попадании в кеш

adeshere Jan 28 at 23:52

Тут важно правильно заботиться о попадании в кеш

На 8086? Или на 80286?

Я тогда такого слова вообще не знал ;-)

Хотя, в начале 1990-х уже как бы появился 486 (с кэшем L1), но мы жили и работали в горной экспедиции, куда новая техника подъезжала с опозданием лет эдак на 10. Да и в институте (куда я вернулся после распада СССР) в 90-е было не сильно лучше. Приходилось выкручиваться на старом железе за счет алгоритмов. Так как как раз в это время наблюдения массово переводились на минутный опрос, и мегабайтные ряды у нас стали нормой.

Sdima1357 Jan 29 at 06:19

Я уже про 20 лет назад говорю. Это пентиум 4 и дальше. А кеши появились уже у некоторых 80386 , это где то 1986 год

adenis78 Jan 29 at 10:23

Вопрос с кэшем оказался сложнее чем показался вначале :)

adenis78 Jan 29 at 10:56

пока проверял, когда появились контроллеры кэша для 386го и как кэш был устроен, истекло время редактирования.
Вот про микросхему 82385, контроллер совмещнного кэша программ-данных для intel 80386 https://theretroweb.com/chips/3095
К ней требовались еще микросхемы быстрой статической памяти для хранения кэшируемых данных.
Первые экземпляры = 1987 год.

c0mmandor Jan 28 at 21:33

в таблице производительность в наносекундах на элемент или в миллисекундах на все изображение? явно не сказано, а кажется сомнительным что фильтр гаусса с сигмой 10 для FP32 изображения 1024х1024 можно посчитать на x86 процессоре за 81.3 нс

Sdima1357 Jan 28 at 22:28

На точку конечно. 4 мегабайта данных только прочитать из памяти нужно порядка миллисекунды или сотен микросекунд (10-89 гигабайт в секунду)

Jijiki Jan 29 at 11:06

1024x1024 уже в памяти - когда я жму на применить фильтр к картинке например в Гимп на ползунки X/Y фильтр применяется на всю картинку почти мгновенно, тут скорее всего время без загрузки картинки 1024х1024 и в примере чб(поидее это 1024х1024х2хsizeof(...) байт ) и еще процессор i9 в тесте написано по крайней мере (мне просто стало интересно я запустил Гимп создал чб 1024х1024(32FP) накалякал чтото там чтоб был чб и применил фильтр, плюс в Гимп может модный фильтр, тут пишут что способ Stack Blur разновидност Гаусса быстрее)

c0mmandor Jan 29 at 11:54

я представляю сколько работает фильтр гаусса в разных условиях, коммент больше направлен на улучшение описания. А то в таблице единица измерения указана не полностью, т.к. видимо это не просто время, это время на один элемент(пиксел) изображения.
единица измерения "почти мгновенно" улыбнула

Jijiki Jan 29 at 12:32

допустим 1024 на 1024 на 2 канала частота 4 ГГц доступ к памяти 3МГЦ, допустим выборка окна 4 на 4 где 4 на 4 в лучшем случае на 2 канала в 1 регистр тогда за такт выполнится 1 к операций поидее ну допустим при 4 ГГЦ это 4 тысячи, 65536 / 4000 (просто предположил)

c0mmandor Jan 29 at 13:30

тут как чего не допускай, но за 81 наносекунду не может быть обработано 1048576 элементов (это 1024*1024), т.к. это около 77 фемто секунд на элемент получится (если арифметика меня не подвела или я ее) 81e-9 / (1024*1024). это ж процессор на терра герцах работать должен, какой бы он i9 ни был, но это пока рановато

Jijiki Jan 29 at 13:34

у нас предположим 1 момент все изображение 1024х1024 - а следующий момент у нас маска выборка по изображению 256 на 256 элементов по 4 на 4 чтото такое. я тоже могу ошибаться просто почемуто подумал что так легче обсчитать если учесть что влезает в регистр маска(отталкивался от словосочетания частота дискретизации. )

c0mmandor Jan 29 at 13:47

да нет, тут как ни крути, оценка в 81 наносекунду для всего изображения не физична. просто в таблице стоит добавить что это nsec / pixel тогда получается 84 миллисекунды на все изображение, вот в это поверю.

SmartEngines Jan 29 at 16:53

Вы правы, наносекунды получатся, если оценивать время на пиксель изображения. В Таблице 2 приведено время обработки всего изображения, поэтому правильная единица измерения - миллисекунды. Спасибо, исправили в статье.

c0mmandor Jan 29 at 17:55

вам спасибо, статья получилась интересная и познавательная

Andy_U Jan 29 at 11:21

А со скоростью вычисления свертки с помощью преобразования Фурье вы свои свои алгоритмы не сравнивали?

SmartEngines Jan 29 at 16:51

Да, это сравнение мы тоже делали. Оно есть в статье, а здесь мы напишем про него в следующей части нашего материала. Спойлер: оказалось не быстрее.

lgorSL Jan 29 at 17:46

Позвольте уточнить, а Вы гамма-коррекцию для изображений делали? Для float32 всё прекрасно, но в случае восьми бит на пиксель либо гамма коррекции нет и фильтр размывает физически некорректно, либо восемь бит с гамма-коррекцией теряют цвета и нужно повышать точность (например, до шестнадцати бит)

Главный подвох в том, что количество фотонов от пикселя яркостью в 127 и 255 отличается совсем не в два раза, а примерно в четыре. Если быть точным, в (255/127)^2.1 раз

UFO landed and left these words here

OldFisher Feb 4 at 05:54

Зависит от целей сравнения, они ведь разные бывают. К примеру, если нужна простая проверка на полное равенство, можно посчитать хэши от обоих изображений и сравнить.

UFO landed and left these words here

OldFisher Feb 4 at 12:32

Увы, при столь неполной постановке вопроса вряд ли получится дать дельный совет.

UFO landed and left these words here

OldFisher Feb 4 at 16:58

3D в браузере - это нечто специфическое. Тут, возможно, придётся погружаться в бездны чёрной магии. Если получится. Скажем, "переквалифицировать" буферы кадра в текстуры или простые буферы и прогнать сравнение через шейдер.