Комментарии 31
Спасибо! Сканирую редко, но этот подход реально может сэкономить время!
Задумался, а нет ли в моей любимой программе PDF24 такой функции. Посмотрел — конечно, есть. Модуль "Объединить PDF", метод — "Сопоставить".
Всем настоятельно рекомендую эту бесплатную и невероятно мощную программу. Всё, что мне до сих пор приходило в голову делать с PDF — она может.
Поддерживаю. Очень удобная программа. Еще бы нумерацию страниц могла проставлять - было б вообще супер. Ради простановки страниц однажды я и познакомился с PDFtk, если память не измееяет.
Adobe Acrobat DC и PDF-Xchange почему-то такого функционала не имеют ?♂️
В качестве альтернативы так же есть бесплатный опенсорсный PDFSAM Basic.
off А чем можно "ремонтировать" PDF? Для файлов, которые "Файл поврежден и не может быть восстановлен."
Не сталкивался с этим. Возможно поможет резервная копия, если она есть?
Я использую PDF X-Change, но она платная :(
При открытии битого файла сразу предлагает сохранить исправленную копию. Рутинное действие для квитанций об отправке электронного заказного письма Почтой России, которые всегда скачиваются с их сайта битыми (не знаю, что они там напортачили).
можно попробовать cpdf или ghostscript
https://www.coherentpdf.com/cpdfmanual/cpdfmanualch1.html#x5-350001.13
когда-то давно помогло починить побитые какой-то питоновской либой файлы
На macOS невозможно установить при помощи brew:
brew install pdftk
Running `brew update --auto-update`...
==> Auto-updated Homebrew!
Updated 4 taps (homebrew/bundle, homebrew/services, homebrew/core, and homebrew/cask).
==> New Formulae
aztfy
==> New Casks
irpf2021 irpf2022 keyfinder scansion
Warning: Calling plist_options is deprecated! Use service.require_root instead.
Please report this issue to the appveyor/brew tap (not Homebrew/brew or Homebrew/homebrew-core), or even better, submit a PR to fix it:
/opt/homebrew/Library/Taps/appveyor/homebrew-brew/Formula/appveyor-server.rb:33
You have 39 outdated formulae and 3 outdated casks installed.
You can upgrade them with brew upgrade
or list them with brew outdated.
Warning: No available formula with the name "pdftk". Did you mean pdftoipe?
==> Searching for similarly named formulae and casks...
==> Formulae
pdftk-java pdftoipe
To install pdftk-java, run:
brew install pdftk-java
Подсказал бы кто программу, которая страницы при сканировании переворачивать будет… :)
Способ хороший, но для большинства пользователей, сканирующих документы, что-то запустить из командной строки - недостижимые высоты мастерства :) (работаю с юристами)
Благо, сканирование в 90% случаев предполагает и OCR сразу, а FineReader так делать тоже умеет из коробки.
Думаю, что согласен на счёт недостижимых высот мастерства :) правда это печально.
У меня например для этих больших документов OCR не предполагался - там всякие сертификаты в основном.
Ну в FineReader можно, в принципе, и без OCR это сделать, раз уж он ради OCR куплен и установлен. Но у OCR, даже если не текстовый слой сам особо не нужен, ещё плюс в том, что листы автоматически поворачивает в зависимости от содержимого (когда в середине документа листов на 300 три широких таблички по 10 листов каждая в альбомной ориентации - бесит). Хотя для простых случаев, согласен, из командной строки мне самому было бы проще.
эх! а я писал скрипт на питоне
from PyPDF2 import PdfFileWriter, PdfFileReader
from PIL import Image### и там далее:
### читаем из pdf страницы как картинки,
### делаем что угодно с картинками,
### сохраняем картинки как страницы в pdf
Для манипуляций с PDF есть еще такая утилита pdfcpu. Написана на Go, может использоваться как библиотека из своих go-программ.
Профит! Спасибо)
Есть еще вариант. Сканируем все (пусть даже) в pdf. Из pdf делаем одностраничные pdf (в Акробате extract pages). Получаем набор pdf, который нужно правильно переименовать. Для этого в Total Commander (или любой другой программе для переименования) вызываем Multi-rename tool. И делаем шаблон с [C] в одном случае start - 1; step - 2, а в другом start - 2; step - 2 (digits - 4). Т.е. любым доступным способом делаем так, что бы при сортировке по алфавиту номера страниц были правильные. После этого объединяем получившиеся pdf в один (можно через Акробат).
Но мой вариант кажется проще :)
PDFtk "инструмент командной строки" - эти три слова многих современных специалистов (не говоря уже о пользователях) вгоняют в скуку и депрессию :-) Поэтому альтернативный вариант кому-то может оказаться проще - нужно всего-то разбить документы постранично, правильно переименовать файлы и собрать обратно все файлы в один документ.
Как сканировать многостраничные двухсторонние документы, если под рукой только обычный сканер с автоподачей