vpanferov 23 мая 2011 в 11:18

Как технология MRC уменьшает размер PDF-документов

4 мин

42K

Блог компании Content AI

+74

Комментарии 27

Disasm 23 мая 2011 в 12:11

Похоже, что всё идёт к тому, что документы будут описываться правилами «как их сделать», а не «что там изобразить».

somniator 23 мая 2011 в 12:28

Поправьте, пожалуйста, JPEG200 -> JPEG2000.

vpanferov 23 мая 2011 в 12:33

Поправил, спасибо.

Trept 23 мая 2011 в 12:36

А текст при этих настройках (FR10, по умолчанию) распознается?
И куда в файле он помещается, как при этом изменяется сжатие?
Достаточно ли для добавления распознанного текста обычного FR или нужен FR Engine?

vpanferov 23 мая 2011 в 12:45

Текст распознаётся и помещается отдельным слоем под картинку.

Весь механизм работает и в FR Engine, и в обычном FR одинаковым образом — у них общий код. В Engine чуть побольше ручек.

Про сжатие я не уверен, что понял вопрос. Pdf представляет из себя текст, картинки и управляющие команды. Обычно картинки имеют самый большой размер.
Технология MRC направлена на то, чтобы уменьшить размер картинок. Размер текстового слоя не меняется, управляющих команд становится немножко больше.

Trept 23 мая 2011 в 12:55

Спасибо за полный ответ.
Имелось в виду под изменением сжатия, что изменились накладные расходы для текста под MRC, и, может, вы научились сжимать и текст внутри PDF.
Насколько я понял, текст не сжимается, а накладные в виде команд несущественно увеличиваются, так?

vpanferov 23 мая 2011 в 12:58

Да.

может, вы научились сжимать и текст внутри PDF.

Давно уже. Текст внутри и команды его вывода сжимаются zip'ом.

IPv6 23 мая 2011 в 13:00

Спасибо, познавательно!

halyavin 23 мая 2011 в 13:38

Когда буквы объединяются в кластер, показывается случайная буква из кластера или «средняя» буква?

vpanferov 23 мая 2011 в 14:07

Сорри, промазал ссылкой и ответил ниже.

Зависит от реализации. У нас «средняя».

halyavin 23 мая 2011 в 14:25

Это хорошо. На мой взгляд это улучшает изображение.

НЛО прилетело и опубликовало эту надпись здесь

vpanferov 23 мая 2011 в 14:07

Зависит от реализации. У нас «средняя».

alisey 23 мая 2011 в 14:12

Вот уж действительно сжимает так, что не отличишь, на второй паре картинок даже URL совпадает.

vpanferov 23 мая 2011 в 14:29

:) Поправлено.

onemew 23 мая 2011 в 14:28

Очень интересные результаты и технология.
Кстати, уже бывшие конкуренты Abbyy, Cognitive Technologies недавно анонсировали нечто похожее.

ice2heart 23 мая 2011 в 15:47

спасибо интересно… ещё интересно какие алгоритмы ищут что есть что…

gavrlans 23 мая 2011 в 16:46

Да, кстати очень интересно как она отличается что етсь просто картинка а что есть буквы.

ice2heart 23 мая 2011 в 16:47

хотя я тут подумал, алгоритм наверное такой, если нельзя распознать считаем это картинкой…
хотя думаю алгоритм посложнее, у них же есть для распознования текстов

gavrlans 23 мая 2011 в 16:57

да даже как текст то распозновать не ясно.
надо определить размер буквы учесть ошибку сканера или фотоаппарата плюс ещё понять откуда начинается текст на странице. интересно было бы про это почитать:)