Комментарии 31
Распечатать выборочные страницы из PDF документа на виртуальный PDF принтер не проще ли?
Это вообще самый оптимальный и удобный вариант с сохранением в ПДФ нужных страниц и он зачастую уже есть в системе. Но тут похоже была жажда программирования. Гораздо полезнее было сделать ПДФ-собиралку вместо разрезалки. Вот чтобы из микса картинок и других ПДФ-ок собрать одну.
Для этого есть LaTeX !
:-)
В моём гите уже есть реализация собиралки из разных PDF, в рамках этого проекта (в другой статье опишу).
Идея была в том чтобы вынести эту функцию удобный интерфейс (идею подал пользователь с работы)
Офигеть!
Учитесь как делать слона из праха мухи ))
Уже лет десять и разделяю и вырезаю и обьекты удаляю из PDF документов, и рекламу из журналов удаляю.
С помощью Adobe Acrobat Pro 9.0.0 андэр зе макось. Наверное уже и новее есть версии, но нет нужды менять. )
А тут портянка текста и кода на неделю, без охлаждения мозга )))
Вообще-то куча консольных утилит которые делают тоже самое и ещё больше.
Быстрый поиск по pdf Tool cli:
https://github.com/uroesch/pdftools
Пользуйтесь.
Отличный велосипед. Для поклонников консоли могу отрекомендовать pdftk-java
https://gitlab.com/pdftk-java/pdftk
There are pdftk-java packages available in a few repositories, including Arch, Debian / Ubuntu, Fedora / EPEL (for CentOS, RHEL, Rocky), Gentoo, Homebrew, MacPorts, Mageia, and SUSE.
Добрый день, больше похоже на дипломную работу, не хватает только экономической части.
А раз зашла речь про разделение pdf, то подскажите, пожалуйста, инструмент для выделения из pdf прямоугольной области. Есть в pdf план помещения на нескольких страницах, на каждом листе изображены разные свойства помещения - размеры, проводка, мебель и т.д. Нужно как-то выделить прямоугольную область и по ней на всех листах обрезать содержимое и увеличить до стандартного листа A4. Чтобы в итоге напечатать или передавать контрагентам информацию о фрагменте помещения и, одновременно, иметь нормальный масштаб при печати.
Интересная идея, я заскриню и на досуге подумаю
Я использую обычный скриншотер для этого. Увеличиваю максимально на площадь экрана PDF, и делаю скрин области, потом его и печатаю или отправляю картинкой.
Для пакетной обработки использую любой pdf2png, а потом также оптом через графический редактор обрезаю все файлы до нужной области.
Бывает, что в экран влезает очень мелко. Можно лист pdf в любом приличном редакторе открыть c dpi на сколько оперативки хватит, а потом взять что требуется.
Пока я примерно так и выкручиваюсь. В XnView MP поставил аддон для чтения pdf. Но пришлось задать конвертацию в растр с разрешением 600 dpi, чтобы мелкие цифры не превращались в три мутных пикселя. А с таким большим растром он заметно тормозит.
Уже упомянутый драйвер печати в PDF умеет не только делить документы на страницы, но и страницы на части. Чтоб, например, разделить страницу на две волне достаточно. Если ещё и с полями поиграться, то можно разбить страницу на несколько документов, один и будет нужным прямоугольником.
Из преимуществ в результате получаем настоящий PDF, а не картинку. Плюс можно наглядно объяснить шефу, как можно заработать больше денег если не жаться на лицензию для нормального продукта :)
Просто копирую оригинальное изображение из PDF (SumatraPDF так умеет).
Ну или извлекаю каким-нибудь xpdf-tool или poppler
Посмотрите pdftocairo из poppler-utils
Посмотрите в сторону Rectangle()
в itext. Текстовые блоки я по заданным координатам из .pdf вытаскивал, по примеру из https://stackoverflow.com/questions/48597948/text-extraction-from-a-pdf-using-itext7-how-to-improve-its-performance
Возможно аналогично можно графику получать...
Есть же pdf24. Уже лет 15 или больше
Pdfsam мержит сплитит и много чего ещё, пользуйтесь
Pet проект. Разделитель PDF документов