Fade Sep 16 2007 at 21:13

DataGlyphs — кодирование информации в изображении

2 min

Исследовательский центр в Пало-Альто (Palo Alto Research Center — PARC), филиал знаменитой американской корпорации Xerox, разработал систему, которая позволяет совместить бумажные документы, предназначенные для людей, с машинным чтением, обладающую ошеломляющим преимуществом над прежними принципами кодировки.

Система называется «ДатаГлифы» (DataGlyphs).
Данные кодируются в виде множества диагональных штрихов (создатели технологии назвали их глифами), каждый из которых соответствует одному биту. Значение бита зависит от направления глифа.

Если оборудование, на котором печатается документ, имеет достаточно высокое разрешение, размеры глифов будут очень малы — не больше сотых долей дюйма. Благодаря этому, на крохотном участке страницы можно уместить сотни байтов цифровых данных. Впоследствии, отсканировав документ, эти данные можно извлечь и раскодировать.

Каждый «ДатаГлиф» (то есть — штрихкод нового типа) содержит решётку синхронизации — регулярный повтор одного и того же набора глифов, который и отмечает границы напечатанной информации и повышает надёжность чтения, благодаря избыточности кодирования.

Даже при уровне избыточности кодирования почти в 30%, по сравнению с самым распространённым стандартом штрихкодов — code39 (без дублирования информации) — новый тип кодирования обеспечивает почти в двадцать раз большую плотность упаковки данных: примерно 155 байт на квадратный сантиметр (при печати на принтере с разрешением 600 точек на дюйм).

И даже в сравнении со стандартом pdf417 — самым совершенным штрихкодом из прежних систем — разница составляет 1,8 раз (в пользу DataGlyphs).

Пользуясь вариацией в толщине соседних глифов и в их цвете, глифами можно напечатать чёрно-белое или цветное изображение, «глифовая» структура которого будет незаметна на глаз (как мы не видим точки разного диаметра при печати фотографий в газете).

Рассуждая дальше, из глифов можно делать серенький фон на текстовых документах, содержащий в себе сам документ в цифровом виде. Эта технология двусторонней печати одного и того же документа (одна сторона «буковками» — для людей, вторая «глифами» — для машин), назван разработчиками GlyphSeal, ему прочат больше будущее. Ведь теперь не нужно будет никаких программ распознавания напечатанных символов для сканирования, скажем факса.

На одной из презентаций разработчики представили прототип сканера, представляющий из себя прозрачную поверхность, на которой, если расположить сканнер над закодированным участком, выводиться закодированная информация.

Но самое главное, технология — Open Source. Желающие могут получить исчерпывающую информацию на сайте проекта: http://www.parc.com/research/projects/dataglyphs/

Hubs:

Lumber room