Pull to refresh

Comments 12

Отличная статья. А главное практичная. Спасибо.

По поводу пропорций — почему бы не попросить пользователя указать тип документа — A4, A3 и т.д. для _более_качественного_ устранения перспективы.
Elsedar, спасибо за оценку нашей работы. В принципе, в нашей программе по сканированию есть выбор формата от А5 до А2, это ограничивает область сканирования документа, и коррекция выполняется внутри этой области (контур при этом все равно ищется внутри этой области). Кстати, размер формата не так важен, важны пропорции и ориентация документа. А у форматов А (N) пропорции одинаковые, насколько мне известно.
Действительно, пропорции одинаковые, сразу не сообразил.
А как физический размер документа может ограничивать область сканирования изображения? Ведь чем мельче объект, тем, вероятнее, его будут крупнее фотографировать.
Elsedar, если речь идет о книжном бесконтактном сканере, а я имел в виду именно софт для него в комментарии выше, то сканирующее устройство располагается всегда примерно на одной высоте, поэтому мы можем (конечно, примерно) обозначить величину зоны сканирования для конкретных форматов. В случае съемки «от руки» задание формата, конечно, не имеет смысла, только пропорции.
По началу заголовка сначала подумал, что статья о том, что будет с документами в будущем.
А так, в общем-то, и было задумано ). Многозначный заголовок.
Спасибо за статью, прочитал с интересом.
«Challenge» в данном контексте = «Входные условия»
Задача определения пропорций прямоугольного документа по координатам его углов имеет точное аналитическое решение. По ссылке можно найти статьи, формулы, пояснения и даже исходный код.
Однако, на практике я бы не рекомендовал пользоваться этим безоговорочно, поскольку очень часто можно оказаться близко к особой точке, и тогда решение будет неустойчивым (очень чувствительным к точному определению координат углов).
Можно повысить устойчивость решения, если фокусное расстояние до объекта известно (желательно в тех же единицах, что и геометрические размеры объекта, т.е. в пикселях). Для определенного типа мобильных устройств без оптического и цифрового зума фокусное расстояние до объекта (выраженное в пикселях) является константой.
Спасибо, да, мы знаем, что есть точное аналитическое решение. У нас стояла несколько иная задача. Нужно было быстро решить задачу максимально универсальным способом.
Что касается фокусного расстояния, мы пока поверхностно изучили вопрос, если есть ссылка на способ перевода фокусного в дистанцию для объекта, который работает независимо от использованной оптики, будем благодарны за наводку.
Наше текущее решение работает и без этих данных, в чем, собственно, и красота, мы не привязаны к источнику получения изображения.

Отлично, как раз думал как применить OpenCV к похожей задаче.
Если есть у кого идеи как исправить искажения изображения с мятого оригинала, буду признателен.

Чуть до кватернионов не добрался. Хотел сперва по уровням областей находить края, потом делить на области и транспонировать в 3D.

Кому интересно, вот ссылка на статью о геометрическом искажении документов.

Sign up to leave a comment.

Articles