Как создавать и изменять интерактивные PDF-формы, или новый скилл ABBYY FineReader PDF

    Мы регулярно обучаем ABBYY FineReader PDF новым навыкам. Две недели назад мы рассказали на Хабре, как научили ABBYY FineReader PDF редактировать целые абзацы. Этот пост — о еще одном продвижении нашего продукта на пути к совершенству: программа теперь умеет создавать и редактировать интерактивные PDF-формы.

    Раньше ABBYY FineReader PDF мог только заполнять такие формы – заявления на отпуск или визу, резюме, согласие на обработку персональных данных, исследования, опросы и т.д. Но что если компании нужно создать в формате PDF анкету, разработать шаблон документа или отредактировать в готовом бланке несколько полей, чтобы затем отправить его сотрудникам или клиентам? Теперь все это можно сделать в одной программе. О том, как это работает, для чего и кому может понадобиться такая функциональность, мы сегодня и расскажем. Поехали!

    Что такое интерактивная PDF-форма?


    Интерактивная PDF-форма – это документ с полями, в которых пользователь может печатать текст, даты, проставлять галочки, выбирать одно или несколько значений из списка и выполнять другие действия, не редактируя основное содержимое документа.

    PDF-формы могут выглядеть по-разному. Приведем несколько примеров:


    Слева направо: первая страница анкеты на получение шенгенской визы; согласие на обработку персональных данных; PDF-форма для запроса сервисных услуг. Картинка кликабельна.

    Если PDF-файл сам по себе – это статичная сущность, которая в первую очередь предназначена для передачи информации, то формы в PDF предназначены для получения информации от пользователей или организаций.
    С технической точки зрения интерактивная форма в PDF – это набор «виджетов». Виджеты – это поля, которые можно создавать, редактировать и заполнять. Термин взят из спецификации PDF (международные стандарты PDF ISO, где описываются все стандартизированные возможности формата PDF). В спецификации сказано, как устроены интерактивные элементы, чтобы это понимал PDF-просмотрщик, то есть программа для работы с PDF. На основе этой спецификации мы и разработали фичу создания и редактирования форм в ABBYY FineReader PDF. Таким образом, интерактивные формы, созданные в нашей программе, будут доступны для заполнения или редактирования и в других редакторах PDF, если они поддерживают PDF ISO.

    В чем преимущество интерактивных PDF-форм?


    • PDF-форма будет одинаково отображаться в любой операционной системе, любой программе и на любом устройстве;
    • PDF-форму легче и быстрее заполнить, чем бумажный документ. Меньше вероятность допустить ошибку;
    • PDF-форму можно заполнять без доступа к интернету;
    • PDF-форму легко напечатать;
    • Отправить форму можно несколькими способами: кнопкой действия (ниже мы расскажем об этом), по электронной почте, загрузить на сервер;
    • Данные из PDF-форм – цифровые, и поэтому их можно сразу отправить в системы обработки данных;
    • PDF-формы легко интегрировать в системы электронного документооборота организаций.

    Приведем пример. Допустим, вам нужно оформить страховой полис для поездки за рубеж. Чтобы не приезжать в офис компании и не заполнять бумажное заявление, можно прямо у себя дома заполнить PDF-форму и отправить ее на почту менеджеру. Кроме того, сотруднику компании не придется перепечатывать данные. Информацию из PDF можно сразу вносить в корпоративные базы данных.

    Как создать PDF-форму


    ABBYY FineReader PDF помогает как создавать формы с нуля, в т. ч. в новом документе, так и отредактировать уже имеющиеся в форме поля.

    Например, можно создать новый PDF-документ, войти в режим форм, нажав кнопку «Редактор форм» на главной панели инструментов, и затем добавить в файл нужные поля.

    Либо можно открыть существующий PDF-документ с полями формы или без них и зайти в «Редактор форм». Если в документе уже есть интерактивные поля, то пользователь увидит сообщение:


    В режиме «Редактор форм» рядом с полями формы отобразятся их имена.



    При желании эту подсветку можно отключить, а имена отредактировать. Кроме того, можно изменить и другие настройки: внешний вид и формат полей, а также назначить значения по умолчанию для отдельных типов полей. Подробнее об этом мы расскажем чуть позже.

    Принимать разные формы? Запросто


    Программа умеет добавлять 7 видов интерактивных полей, которые многим знакомы:


    Текстовое поле. Позволяет ввести строчку или несколько строк текста. К вводимому тексту можно применить форматирование, например, сделать из него дату. Если такое форматирование характерно для поля, то в окошке поля можно вызвать календарик и выбрать дату там. Пользователь сам может выбирать формат даты (например, 18.12.1987 или 1987/18/12).


    Форматирование даты, как и любое другое форматирование, задается в поле формы при помощи JavaScript-инструкций. В продукт встроен JS-движок, который умеет эти инструкции выполнять и помогать пользователю вводить необходимый текст.

    Флажок (check box). Позволяет поставить галочку, например, дать согласие на обработку данных, указать специальные условия при выборе номера в отеле, оформить подписку на новости и др.


    Примечательная особенность: если вы думаете, что галочка в check box нарисована (векторными командами или картинкой), то это не всегда так. При создании check box в ABBYY FineReader PDF галочка — это символ. Есть специальный символьный шрифт, ZapfDingbats, и состоит он не из букв, а из вот таких специальных символов. И в нашем check box просто получается текст из одного символа этого шрифта.

    Переключатель (его еще называют «радиокнопка»). Этот элемент позволяет выбрать только один из возможных вариантов в списке.


    Переключатель в PDF – это наиболее яркий пример, как одно поле может содержать несколько виджетов. У каждого из них есть choice name (имя выбранного состояния), которые предустановил PDF-просмотрщик. Именно это имя прописывается в поле, когда какая-то кнопка выбрана. Каждый виджет имеет несколько предустановленных состояний (ChoiceName/Off, Normal/Down). И в зависимости от того, в каком состоянии виджет находится, такое состояние и будет показываться пользователю. Никакой анимации, просто подмена одной картинки на другую.

    Раскрывающийся список. Дает возможность выбрать одно из заранее заданных значений или, если позволяет форма, ввести свое (произвольное )значение.



    Список. Можно выбрать несколько вариантов.



    Кнопка. Позволяет установить действие, которое выполняется при определенном событии (то есть взаимодействии с кнопкой). Например, при клике на кнопку или наведении курсора можно отправить форму по email, напечатать, сохранить, показать вложенные файлы, очистить форму и так далее.Вместо клика на кнопку можно выбрать и другие события, например, отпускание курсора и т.д. Вариантов действий много:



    Поле подписи. Позволяет указать в документе место, где надо поставить цифровую подпись:



    Совершенствуем форму дальше


    Чтобы форма была понятной для пользователя, можно настраивать различные свойства для всех элементов форм и менять их в процессе редактирования.

    1). Имя поля. Это внутреннее имя, которое помогает создателю формы ориентироваться в документе.



    2). Подсказка. Она появляется, если навести указатель мыши на поле, и позволяет пользователю понять, что требуется сделать и какую информацию внести.





    3). Можно сделать любое поле обязательным для заполнения. Тогда оно будет выделено красной рамкой, чтобы пользователь обратил внимание: в это поле необходимо внести информацию, чтобы форма была принята и рассмотрена. Красная рамка не накладывает ограничений на отправку или печать PDF-формы.



    4). Опция «Только для чтения». Если выбрать ее, то поле станет недоступным для редактирования. Бывает, что в форме может быть информация, которая должна оставаться неизменной. Например, в опроснике для сотрудников-мужчин о том, какие подарки они предпочитают дарить женщинам, может быть поле «Пол»: туда можно вписать значение «Мужской» и оставить его неизменным. Это как бы подразумевает, что опрос для мужчин.

    5). Внешний вид полей. Можно выбрать цвет заливки, толщину границ, свойства шрифтов и многое другое. Оформление всей формы можно настроить по умолчанию: тогда у всех новых полей, которые пользователь создаст в документе, будет единый внешний вид.

    Расскажем о еще нескольких полезных действиях, которые пользователи могут совершать с при создании или редактировании форм. Любое из полей после создания можно перемещать в пределах страницы, копировать или удалять. Размеры полей также можно поменять.

    Кроме того, чтобы форма не только приносила пользу, но и красиво выглядела, в программе есть инструмент, который аккуратно выровняет все поля по вертикали и горизонтали. Направляющие появляются при перемещении поля и помогают его выровнять относительно соседних полей или границ страницы.



    Конечно, когда мы разрабатывали редактор форм в FineReader PDF, то оценивали, какие задачи нужно решать конечным пользователям. Расскажем о них.

    Нужно разработать шаблоны для документов


    С помощью ABBYY FineReader PDF государственные организации, а также юридические, страховые, медицинские и другие компании могут создавать в PDF шаблоны документов, которые необходимо заполнять в электронном виде:

    • заявления на отпуск,
    • разные виды юридических заявлений (на развод, опеку, алименты, смену имени, юридическую помощь),
    • шаблоны контрактов, резолюций, уведомлений, доверенностей,
    • маркетинговые формы для заказов, запросов и др.

    Исходный документ, как правило, создается в MS Word. Он содержит текст и «пробелы» для добавления полей. Затем пользователь конвертирует документ в PDF, чтобы в редакторе форм создать поля, которые будет удобно заполнять.

    Чтобы структуру формы, основное содержание и общий внешний вид нельзя было изменить, можно паролем защитить документ от редактирования, оставив доступным лишь функцию заполнения.



    После того как пользователь заполнил этот документ, он может напечатать его и подписать от руки, либо добавить цифровую подпись и отправить по почте.

    Нужно собрать данные и отправить информацию в другую организацию


    В программе ABBYY FineReader PDF компании и государственные организации могут создавать и редактировать различные электронные бланки для сбора данных, например:

    • заявления на визу,
    • заявления на патент,
    • заявления на регистрацию лекарственного средства,
    • налоговые декларации,
    • заявление на прием к врачу,
    • формы согласия на медицинские манипуляции и т. д.


    В электронном виде такие бланки проще заполнять и обрабатывать. Кроме того, сотрудники могут быстро отправлять такие формы внутри организации или за ее пределы, чтобы сразу получить ответ от коллег, консультации и др.

    Нужно провести опрос внутри компании, обеспечив конфиденциальность данных


    Для проведения внутренних исследований, опросов и аудитов в компаниях не всегда возможно использовать онлайн-сервисы типа SurveyMonkey и Google Forms. Они могут не подойти из-за требований к безопасности и политики управления персональными данными. В таком случае можно заменить онлайн-инструменты на интерактивные PDF-формы.



    Надеемся, что ABBYY FineReader PDF поможет упростить многие задачи, требующие создания и редактирования интерактивных PDF-форм. Если вы хотите попробовать новую функциональность, то программу можно бесплатно скачать и пользоваться ей в течение триального периода.

    Пишите в комментариях, о каких еще технологических особенностях нашей программы вам было бы интересно узнать?
    ABBYY
    Решения для интеллектуальной обработки информации

    Комментарии 13

      +1
      В принципе суть понятна, а теперь объясните три простых вещи:
      1. Чем FR15 лучше для создания таких форм чем бесплатный ОО? Возможностью скопировать, быстро распознать и переделать чужую форму?
      2. На стороне клиента — чем такие формы, кроме наглядности и необходимости тяжеловесного Адоб ридера (ибо простые гляделки не поддерживают заполнение форм) лучше простой текстовой формы, которую можно заполнить на коленке в любой ОС, и гляделки (можно даже серверной), с помощью которой такую форму можно просмотреть в отформатированном виде, проверить на правильность по каким-то простым правилам и исправить, при необходимости?
      Про размеры простых текстовых файлов в сравнении с ПДФ и пропускной способностью каналов и разных служб, принимающих формы — вообще молчу. Зашифровать можно любой файл — чем меньше, чем проще и быстрее.

      В очередной раз у Абби — как у Виктор Степаныча — Хотели как лучше, а получилось как всегда…

      Поставьте вы во главу угла простые принципы:
      1. Данные для обработки/передачи, если не требуют защиты, должны иметь МИНИМАЛЬНО достаточный размер и самую широкую поддержку другим софтом, включая манипуляции с ними… (размер/структура пакета FR, возможность обработки в стороннем приложении — Пайнтдотнет, Кромсатор, Скантайлор, Фотошоп для особо талантливых/ быстрого реимпорта отдельных страниц пакета).
      2. Действия, сделанные в программе пользователем, должны без проблем переноситься вперёд и НАЗАД по версиям...(Я так понимаю, по Аббийской традиции, FR14-12 пакеты FR15 c расставленными блоками экспортировать не могут)
      3. Программа должна иметь минимальный размер и ЗАГРУЖАТЬСЯ И работать на одном железе ЗАМЕТНО быстрее старой версии. Сравнивая размер и функционал 8 и последующих версий — размер FR растёт в разы быстрее…
      4. Программа от версии к версии должна делать лучше свою основную работу, а не растекаться по смежным областям, где нужно конкурировать со сторонним софтом, гораздо лучше заточенным на сторонние функции.
      5. Такие вещи надо описывать детально в Справке/Преимуществах новой версии, а не на маргинальном для большей части простых пользователей Хабре.
        +1
        niccolo2019 1.Чем FR15 лучше для создания таких форм чем бесплатный ОО?

        Сравнивать не совсем корректно, так как они используются несколько для разных целей.


        2.На стороне клиента — чем такие формы, кроме наглядности и необходимости тяжеловесного Адоб ридера (ибо простые гляделки не поддерживают заполнение форм) лучше простой текстовой формы, которую можно заполнить на коленке в любой ОС, и гляделки...

        Мы рассказали про плюсы PDF-форм в статье. В первую очередь, лучше тем, что PDF-форма будет одинаково отображаться в любой операционной системе, любой программе и на любом устройстве.


        1.Данные для обработки/передачи, если не требуют защиты, должны иметь МИНИМАЛЬНО достаточный размер и самую широкую поддержку другим софтом, включая манипуляции с ними… (размер/структура пакета FR, возможность обработки в стороннем приложении — Пайнтдотнет, Кромсатор, Скантайлор, Фотошоп для особо талантливых/ быстрого реимпорта отдельных страниц пакета).

        Все зависит от сценария работы и решаемой проблемы. Спасибо за обратную связь. Передали информацию продуктовой команде FineReader PDF.


        2.Действия, сделанные в программе пользователем, должны без проблем переноситься вперёд и НАЗАД по версиям...(Я так понимаю, по Аббийской традиции, FR14-12 пакеты FR15 c расставленными блоками экспортировать не могут)

        Поддержка новых технологий и фич не всегда позволяет поддержать обратную совместимость.


        3.Программа должна иметь минимальный размер и ЗАГРУЖАТЬСЯ И работать на одном железе ЗАМЕТНО быстрее старой версии. Сравнивая размер и функционал 8 и последующих версий — размер FR растёт в разы быстрее…

        Мы работаем над этим. Размер зависит от многих факторов. В частности, увеличение размера нового FineReader PDF связано с переходом на новые гибридные технологии распознавания с использованием нейросетей. Повышение качество OCR для нас является приоритетом.


        4.Программа от версии к версии должна делать лучше свою основную работу, а не растекаться по смежным областям, где нужно конкурировать со сторонним софтом, гораздо лучше заточенным на сторонние функции.

        Основная функциональность FineReader PDF — это работа с PDF, поэтому создание и редактирование PDF-форм — это не что-то отвлеченное, а расширение наших функциональных возможностях в распространенных PDF-сценариях.


        5.Такие вещи надо описывать детально в Справке/Преимуществах новой версии, а не на маргинальном для большей части простых пользователей Хабре.

        Спасибо за фидбэк, учтем. Кстати, в справке на сайте ABBYY эти вещи описаны детально.

          0
          1. Сравнивать некорректно — Согласен. Но тут мы рассматриваем конкретную функцию. Насчёт функционала и использования — ОО используется чаще, значит, чтобы побить его на каком-то поприще, надо предложить лучший функционал за меньшие деньги… Для Вас тут проблема в том, что ОО бесплатный…
          2. Вы рассуждаете как теоретик. Посмотрите цветные чертежи в Ридере и той же Суматре… Вас ждёт масса чудных открытий. А про одинаковость показа файлов, если в системах отсутствуют шрифты из них, а глифы не встроены в PDF, я вообще молчу (вспоминая знатную проблему FR8 использования моноширинного курьера для данной цели из-за чего в импортированных картинках буквы налазили друг на друга и получалась откровенная жесть — а ведь должно показывать одинаково?)
          3. В чём смысл затруднять доступ к данным в любой задаче? Любые затруднения требуют ресурсов на их преодоление. А когда затруднения создаются самостоятельно а потом героически преодолеваются — почитайте Мифы и легенды Древней Греции — про Сизифа.
          4. Странно, почему Autodesk, MS, Adobe — поддерживают обратную совместимость с некоторыми ограничениями, а у АББИ прям супер пупер технологии, в которых это невозможно?
          5. Вы уже 10 лет как-бы работаете — только простым пользователям результаты работы в плане основного функционала не заметны. В последнем FR вы заработались настолько, что у вас даже некоторые русские надписи в интерфейс не влезают. Идёте по пути MS — пусть страдают пользователи? Я уже писал одному вашему коллеге, что 15 версия распознаёт хуже 8. Распознавание текста с ударениями и невозможность их убрать при экспорте средствами FR, т.к. другой софт обычно просто не понимает такой текст, как простой русский, просто подчёркивает НИЖАЙШИЙ уровень понимания разработчиками собственной программы и путей её использования.
          По поводу повышения качества OCR:
          1. Не смешите… Именно в этом отношении у вас явный регресс, если под качеством OCR рассматривать безошибочность макетирования и распознавания… Наверное нейросеть ещё плохо обучена…
          2. Не могу понять — почему не используется фоновая рекурсия (в плане проверки/перераспознавания страниц ниже/далее) при исправлении характерных ошибок или добавлении новых слов в словарь?
          3. Слабое взаимодействие программы с пользователем, там где сбоят её алгоритмы, тоже будет барьером на пути улучшения.
          4. Предложу функцию автоматического исправления слов по частотности встречи словосочетаний в поисковике (для неконфиденциальных документов).
          5. И облегчите работу с программными словарями, раз вы сами их не особо пополняете — импорт слов со словоформами из словарей HSpell, добавление новых слов со словоформами, как в Орфо.
          6. Основная работа с ПДФ? Вы вроде русский — знаете какая есть большая проблема с ПДФ? Куча ПДФ наделанных в старом адобошлаке с непонятными кодовыми страницами, в которых не работает ни поиск, ни копи-паст. Что-то не вижу функции автоматического исправления таких документов?
          Также не вижу расширенных средств редактирования на уровне обычного редактора?
          7. Распознавания формул, которое уже даже другие на технологиях Абби сделали, от Абби мы видимо никогда не дождёмся…
          0
          Не подскажете, что такое «бесплатный ОО»? Не могу найти.
        0
        Недавно товарищ пытался создать опросник при помощи вашего инструмента. Не смог найти\впилить «ползунок» (range). Планируете добавлять элементы?
          0

          A164 не совсем понятно, какие элементы имеются в виду? Уточните, пожалуйста, более детально.

            +2
            ползунок (range) для выбора значения от мин до макс. диапазон и другие характеристики задаются отдельно.
            пример в html — input type=«range» min=«0» max=«100» step=«1» value=«50»
              0

              A164 спасибо. Напишите, пожалуйста, в саппорт и поделитесь подробностями сценария: что именно за опросник создает ваш товарищ, для чего именно ему понадобился "ползунок"? Нам это интересно, хочется разобраться в деталях.

          0
          Уважаемый ABBYYTeam!
          Подскажите, пожалуйста, по теме, немного не связанной со статьей на прямую.
          1. Будет ли доделано в последних версиях FR распознавание слитного рукописного текста.
          Или распознавание рукописных печатных букв — лучшее из того, что можно найти в ваших продуктах?
          2. Насколько долго продлится маркетинговое предложение по снижению цены на 50% для учебных и научных учреждений РФ на FR.
          3. Возможно ли приобретение механизма распознавания без среды (как TESSERACT, напиример), но с повышенным качеством распознавания рукописей.
            +2

            OBIEESupport


            1. Мы работаем над этим, но пока точных сроков назвать не можем.
            2. Вероятно, вы имели в виду скидку 40% для студентов, преподавателей и образовательных учреждений. Это предложение действует постоянно.
            3. Купить SDK можно — ABBYY FineReader Engine. По теме повышенного качества распознавания рукописей — см. п. 1
            0
            А можно ли добавить в такую форму поле для добавления фотографии?
              0

              News2002 Сейчас такого поля нет. Передали информацию продуктовой команде, они обсудят такую возможность. Спасибо вам за обратную связь!

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое