Как формат PDF перестал ассоциироваться с бревном

    Пролог

    На работу привезли в рамках акции новые программы для документооборота — корпоративные профессиональные версии. Они нам программы — мы им свое частное и публичное мнение. Ставить их, к слову, вместо не совсем лицензионных версий этих же программ от Adobe. Соответственно, задачи, которые возлагаются на программы — работать с PDF (конвертировать их по-всякому, и т.п.), сканировать документы и распознавать символы. Меня посадили с этим ПО разбираться — вдруг там все на китайском, и вообще.

    Действие первое, второе и третье

    Привык к тому, что PDF — это как область с наименьшей энтропией, только для документов. С ним самим кроме конвертации ничего особенно сделать нельзя, и это, например, позволяет передавать в PDF любую информацию, в неизменности которой можно быть более-менее уверенным. Так вот, в пух и прах мои представления.
    Итак, сделал для себя ряд интересных выводов:

    Что PDF можно конвертировать в любые форматы и таким опосредованным образом изменять, уже в виде Doc, Xls и так далее, — этим никого не удивишь. Это PDF Converter, естественно, умеет (одна из 3 программ, которые дали тестировать).

    — Функция «Drag-n-Drop» (по-русски «перетаскивание») в программе PDF Converter порвала шаблон на корню. К примеру: вам нужно к 20 страницам PDF добавить 5 страниц текста Word, в середину текста. Решение: берете и перетаскиваете. Вот так вот запросто.

    — Еще оттуда же:
    У вас есть бланк, бумажный. А нужна такая же форма, но электронная и заполняемая. Решение: берете и сканируете в PDF Converter-е ваш бланк, и он автоматически превращается в заполняемую PDF-форму, которую можно заполнять, сохранять, слать по почте, и т.д.

    — Нужно исправить закравшуюся ошибку, или примечание поставить, или картинку загрузить? Просто открываете PDF в программе и исправляете, ставите, загружаете. Как с .doc абсолютно.

    — Нужно найти конкретный документ, или что то в конкретном документе? В Converter есть утилита Looks-Like-Search (от Google), которая помогает найти в PDF ключевые слова, и также найти документ по содержащимся ключевым словам, фразам.

    Последнее, что в этой программе порадовало — форматирование при любых конвертациях в любые поддерживаемые форматы блюдется свято.

    Это был PDF Converter. Вторая программа называется OmniPage. Она, номинально, для сканирования документов и распознавания символов. Фактически может тоже несколько больше:

    OmniPage:
    — Распознает очень хорошо, без шуток. Никаких промежуточных сохранений бумажного документа при этом делать не надо — сразу сохраняет распознанное (текст, изображение, иероглифы, короче, — файл) в выбранном формате, например, Word. Экономия времени на лицо.

    — Задача: вам надо собрать определенные данные из большого количества форм/бланков/документов, например, телефоны сотрудников. Программа автоматически сделает это за вас, если задать критерий отбора (телефон/инициалы/адрес/дата договора/организация, и т.п.). Отобранные данные будут сохраняться в Xls, формат также может быть изменен вручную.

    — Можно загружать и распознавать файлы из DropBox, EverNote, SharePoint и еще каких то не настолько популярных в россии сервисов хранения данных.

    — Очень понравилось: создание аудио-файлов из электронных и бумажных документов. Т.е. наряду с распознаванием символов используется технология Text-to-Speech (Текст-в-Речь). Качество речи идеальное, т.е., если в документе нет грамматических ошибок, или если он не про квантование полей (хотя может и такой словарь в здешней базе имеется), то за один клик вы из документа получаете аудио-дорожку с надиктованной электронным, но вполне приятным и даже интонированным голосом.

    — Из прозаичного: сканирует одним кликом, быстро конвертирует и распознает. Программа удобна при работе с большим количеством документов.

    Третье решение — PaperPort. Классический файловый менеджер с упором на облачные сервисы (GDocs, SilverLight, проч.), чтобы документы можно было достать отовсюду, с iPad например. Очень полезен, если в офисе большое количество сканирующих устройств — централизует и заметно упрощает документооборот.

    Эти 3 программы от компании Nuance, так что и ссылки по продуктам на их сайт. У нас они продаются через Softline.

    Эпилог

    До этого работал с аналогичными приложениями от ABBYY и Adobe — во многом похоже, так что я постарался упоминать функции, частично или полностью могущие называться «ноу-хау». Не знаю, почему именно на Nuance пал выбор конкретно в нашем случае, но подозреваю, что дело в цене корпоративной лицензии.

    Продукты, разумеется, претендуют на вполне определенную конкуренцию с никому не известными решениями от компаний на «A», однако, вопреки первоначальному скепсису, оказались с речевым колоритом и с отраслевой изюминкой. В общем, неожиданно качественно, откуда не ждал.

    Комментарии 22

      0
      софт только виндовый?
      +2
      Интересно, надо будет посмотреть подробнее.

      Пока не читал сайт, задам, если можно, вам несколько вопросов, может вы в курсе.

      1. Умеет ли он в автоматическом режиме конвертировать DOC/DOCX в PDF?

      2. Как построена работа с аннотациями и цифровыми подписями?
        0
        1. умеет

        2. пока не сталкивался сам, — честно говоря, не в курсе.
        0
        Подскажите бесплатную программу, которая способна удалять и переворачивать страницы в документе PDF, больше ничего не надо.
        У наших юзеров стоит поточный сканер, часто не детектирует пустые странички, либо кладут в податчик не так…
          +1
          В MAC OS X Lion именно такая функциональность (удаление, вставление и переворот страниц) встроенна в систему. Я перепробовал несколько сторонних программ, прежде чем узнал, что встроенный просмотрщик такое умеет. Возможно и в Windows программа-просмотрщик PDF обладает такой функцилнальностью.
            +4
            Эмм… а в Windows есть встроенный просмотрщик PDF?
              0
              Вот бы еще найти аналог Skim (http://skim-app.sourceforge.net/) под Windows… в свое время, когда нужно было кучу форм заполнить, всей командой бегали к общему аймаку, т.к. ничего удобнее не попадалось.
            0
            есть такая free pdf reader, на том же сайте — переворачивать точно умеет, удалять скорей всего тоже
              0
              Так она же пересохранять повернутый не умеет…
              0
              pdftk
                0
                Суровая утилита :)
                Но пользователям лучше что-то с гуем.
                0
                PDF Split and Merge умеет переворачивать, склеивать и резать pdf
                  0
                  pdftk
                    0
                    Спасибо, уже смотрел по совету товарища выше.
                    Надо утилиту, объединенную с просмотрщиком.
                      0
                      pdftk+xpdf (или любой другой просмотрщик)

                  +16
                  А почему в блоге PDF, если это всё банальная реклама?
                    +6
                    Уже третий пост автора в профильных блогах с рекламой Nuance
                    0
                    Конвертирование из PDF в другие форматы для редактирования — это как декомпиляция для исправления багов или добавления в программу новых функций. Да, в принципе возможно. И даже иногда оправдано, если у вас нет исходников, а изменить готовый документ очень надо. Но назначение PDF не в этом.
                      +2
                      Я так понимаю, что этой рекламной статьёй вы отрабатываете цену корпоративных лицензий этих трёх продуктов? Попробуем подсчитать, за сколько вы готовы нарушить правила Хабра и получить лучи недовольства от хабрапользователей. Правда, цену корпоративных лицензий на сайте стыдливо умалчивают, но в качестве точки отсчёта возьмём цены персональных лицензий. Итак: PDF Converter Professional (судя по фичам) стоит $100, OmniPage Professional (судя по фичам) — $500, PaperPort Professional (судя по фичам) — $200.

                      Итого минимум $800. Ну неплохо, чо.
                        +6
                        PS. На всякий случай поясню, что именно вы нарушили: пункт 3 правил сайта.
                        3. Хабр — не магазин. Рекламировать товары, услуги, проекты, аккаунты и прочее, размещать в своих топиках ссылку на свой блог/сайт можно только в двух случаях: если топик находится в блоге «Я пиарюсь» или если эта ссылка ведет на конкретный файл/документ/пример, то есть то, что неудобно/невозможно разместить непосредственно в самом топике. Также не разрешается размещать рекламу в хабрацентре.
                          –5
                          рад, что вы прониклись)

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                        Самое читаемое