Megas Jun 24 2011 at 12:23

Размышления о восстановлении испорченного изображения

2 min

3.5K

Image processing *

+37

Comments 32

nooze Jun 24 2011 at 12:36

В этом способе есть один жирный минус — изображение будет очень плохо сжиматься. Фактически его размер будет примерно равен размеру bmp изображения.

nooze Jun 24 2011 at 12:43

Скорее всего будет выгоднее хранить 2 или даже 3 копии изображения в формате типа png вместо закодированной несжимаемой шумной сетки.

youROCK Jun 24 2011 at 12:49

Я думаю, просто размер этих самых рандомных блоков сделать в 16х16 (для JPEG), и будет, хоть и не такой крутое восстановление, но, тем не менее, всё равно будет.

nooze Jun 24 2011 at 12:54

Да можно поэкспериментировать с размером блоков.

Думаю технология будет иметь смысл, если размер полученной картинки не будет больше чем два исходных

Azya Jun 24 2011 at 13:47

Провел эксперимент на приведенных изображениях:
png:
оригинал — сжатие 0,5
кодированное — сжатие 0,85
jpg:
оригинал сжатие — сжатие 0,3
кодированное — сжатие 0,51

Не так уж все и плохо.

acmer Jun 24 2011 at 15:35

Существуют и рабочие методы:
cgm.computergraphics.ru/issues/issue17/poissonimaging

naum Jun 24 2011 at 12:38

Сделайте хайрезы по клику, пожалуйста. Хочется разглядеть.

Megas Jun 24 2011 at 12:46

Картинки в статье имеют точно такой же размер, как и изображения с которыми я работал. Если нужно могу провести тест на каком нибудь изображении побольше.

UFO landed and left these words here

Megas Jun 25 2011 at 17:07

Обновил пост.
Пришлось переписывать программу, чтоб смогла работать с изображением таких размеров.

UFO landed and left these words here

merlin-vrn Jun 24 2011 at 12:39

Круто, только вот битмапы никто в чистом виде не хранит. Сжимают.

А для сжатых данных алгоритм в чистом виде не применим. А в не совсем чистом виде он очень давно уже есть в Progressive JPEG, в котором можно «потерять» часть конца файла, и всё равно распаковать картинку меньшего качества.

OverQuantum Jun 24 2011 at 13:45

Практика ремонта JPEG-ов в течение нескольких лет показывает, что при сбое Progressive JPEG восстановлению подлежит только изображение очень низкого разрешения — первый скан, а все дальнейшие сканы восстановлению не подлежат совсем.
С другой стороны, в случае sequental, даже заметный сбой в начале/средине может быть нивелирован — «выкусыванием» сбойного фрагмента с восстановлением всего изображения после сбоя.

OverQuantum Jun 24 2011 at 14:02

Помимо уже указанной невозможности сжать изображение после такого кодирования, есть и другие побочные эффекты.
1) Если окончание изображения не было «оторвано» или залито чёрным, а заменено фрагментом другого изображения, вы получите смесь из двух изображений. При примерно одинаковой яркости вы можете уже не подобрать фильтр, который подавит одно изображение и выделит другое.
Пример: восстановление удалённых файлов обычно приводит к такой каше из файлов.
2) Если средина файла была утрачена, а всё что после сдвинуто к началу, причём вы не знаете на сколько байт — сдвинутые данные распакуются на неправильные места и вы вместо *всего* изображения снова получите «помехи».
Пример: при перегреве флешек данные из них копируются с потерей синхронизации — с выпадениями и сдвигами.
3) Самое уязвимое место файла — заголовок. Для адаптивного JPEG-а повреждение таблиц Хаффмана (100-200 байт в заголовке) означает полную потерю изображения.

В целом вам нужно оценить устойчивость вашего кодирования к:
1) Замене данных на произвольные — белый шум, часть другого изображения вашего же формата, константы, BMP-образные данные и т.п.
2) Вставке чужих данных со сдвигом
3) Потере со сдвигом фрагмента файла вашего формата
4) Повреждению заголовка, в котором записана информация о типе кодирования, размере файла, типе и параметрах кодирования.

alexzzam Jun 24 2011 at 14:19

Так всё и есть. Но, как я понимаю, автор не пытался соорудить защиту от какого-то повреждения файлов, встречающегося в реальной жизни. Ну, то есть, эта вот заливка части изображения чёрным — чисто умозрительная опасность. И пост (как, опять же, я понял) — это просто ответ на голографическое кодирование недавнее. В духе «гологаммы интересно, но ровно та же задача решается лучше вот так».

SKolotienko Jun 24 2011 at 14:15

Выше написано много комментариев с рассуждениями о том, что так будут страдать алгоритмы сжатия. Но почему никто не спросил, при каких условиях вообще будут возникать дефекты такого рода? (большие связные дефектные области)

Если дефекты будут возникать на бинарном уровне, то тогда проще придумать формат изображения с избыточной информацией, и восстанавливать с помощью например тех же кодов Рида-Соломона

OverQuantum Jun 24 2011 at 14:56

> при каких условиях вообще будут возникать дефекты такого рода? (большие связные дефектные области)
Условия не такие уж и редкие. Повреждение фотоснимка на флешке довольно часто убивает существенный фрагмент файла — в средине или до конца. Недокопировался, недозаписался, записался криво, удалён и восстановлен после записи на флешку.

> восстанавливать с помощью например тех же кодов Рида-Соломона
Рид-Соломон добавляет возможность восстановления ~X% объёма исходного файла за счёт добавления ~2X% к хранимому объёму. Засада в том, что если повредится больше X% объёма файла, то Рид-Соломон не сработает вообще.

TerVaN Jun 24 2011 at 15:00

Еще проще не использовать такой канал, на котором могут возникать такие дефекты. Избыточность и помехоустойчивость лучше применять уровнем ниже, ко всему каналу или протоколу сразу. Чтобы не придумывать отдельный алгоритм для каждого типа передаваемых файлов или данных. Уж очень сложно делать по новому алгоритму для всех возможных типов данных )

Sulako Jun 24 2011 at 18:59

Условия простые — снимок распечатан, половина оторвана, и снова отсканирован :)

dragonhome Jun 27 2011 at 06:37

Перемешанный снимок распечатан,
Нафиг кому нужно распечатывать перемешанный снимок непонятно правда.

acmer Jun 24 2011 at 15:34

Извините, но в приведенном примере задействано исходное изображение.
Да, вы пишите, что в теории можно картинку для начала размазать и применить метод. Но на практике это не показано. А ведь чудес не бывает, потерянную инфу легко не вернешь.
Советую почитать по теме: cgm.computergraphics.ru/issues/issue17/poissonimaging

librarian Jun 24 2011 at 15:49

ВО! Нашёл! habrahabr.ru/blogs/image_processing/120473/ Вам явно сюда!

KreatoR Jun 24 2011 at 17:34

Метод методом, но объясните мне пожалуйста, КАК, откуда программа знает что было на испорченном куске?
Что именно кресла-лежалки в таком порядке, что именно их было столько, и что там не было, допустим, человека?
Система понятна, но непонятно, откуда она знает, что там должно быть?

Nashev Jun 25 2011 at 09:27

Вам система непонятна. Перечитайте статью.

KreatoR Jun 25 2011 at 12:46

Перечитал.
Но в комментарии я задал конкретный вопрос, откуда программа знает что должно быть на вырезанном куске, именно сидушки, а не край автомобиля, разрушенный дом, толпа людей, а именно это?
если я дам вам отрезанный кусок фотографии, вы сможете восстановить то что там было?)

Nashev Jun 26 2011 at 11:44

Программа этого не знает. Она просто переставляет пикселы заранее заданным образом.

Автор портит закодированное изображение, в котором пикселы уже переставлены. Ситуация, когда испорчено оригинальное изображение, автором не рассматривается.

Ariman Jun 24 2011 at 18:38

Если перевести картинку в частотную область, то потеря достаточно большой части коэффициентов не сильно скажется на изображении. Грубо говоря критичны будут несколько первых, что в НЧ. Те что в ВЧ вызовут потерю резкости.

А вообще, давно уже придумали помехоустойчивые коды, того же Рида-Соломона, кодируйте свои важные данные и будет вас ЩАСТЬЕ)

dime Jun 27 2011 at 08:55

Рид с Соломоном рулят, но они о другом типе помех. Пример автора, конечно, надуманный и практической ценности в нём мало (в том виде, как он описан), но результат достаточно любопытен и имеет смысл для дальнейшего анализа.

Ariman Jun 27 2011 at 12:16

Ну как вариант, на вскидку, можно наиболее значимые коэффициенты ДКП защитить избыточной информацией (тем же соломоном), а оставшиеся бросить как есть. Таким образом потеря низкочастотных коэффициентов скомпенсируется избыточностью помехозащищенного кода, а потеря высокочастотных не так страшна и приведет к некоторому размытию картинки.

dime Jun 28 2011 at 06:18

От описанного типа дефектов это не спасёт. Вот если совместить перемешивание с вашим вариантом, тогда да, конечно. Получится ещё лучше. Ценность исследования в том, что даже такой примитивный метод (без расчехления теории чисел, полей, колец и циклических кодов, не говоря о разложениях в ряды) даёт потрясающе приемлимый результат. Осталось малое — придумать куда эту байду прикрутить. :) Как-то сходу не могу найти места, где такие дефекты могут сгенерироваться :).

Ag47 Jun 24 2011 at 19:58

One pixel camera dsp.rice.edu/cscamera
Немного не по теме, но по сути об одном. В топике про восстановление по части, а тут в некотором роде сжатие за счёт рандомизации.

dobersoft Jun 26 2011 at 19:20

О прогрессивном сжатии автор не слышал?