Comments 24
Хороший обзор, благодарю!
Часом, в процессе работы вам не приходилось конвертировать в PDF страницы с SVG-графикой? Интересно, как справляется с ней wkhtmltopdf.
Часом, в процессе работы вам не приходилось конвертировать в PDF страницы с SVG-графикой? Интересно, как справляется с ней wkhtmltopdf.
К сожалению не приходилось.
Справляется ок. единственный недочет — если в графике на странице есть прозачности (как я понял, этот баг не только к svg относится), на этой странице портятся шрифты в акробат ридере. В остальном же, график, нарисованный с помощью Raphaël никаких сюрпризов не подсунул.
а вот устроить конвертацию из pdf в html, если там есть таблицы ух как не просто
Пользовался на нескольких проектах DomPDF, очень удобная штука, странно, что автор не включил ее в обзор
Перезагрузите картинки на habrastorage.org/, будут отображаться у всех, заодно от удаления на внешнем сайте защитите.
Спасибо, полезный обзор!
Хм… странно почему одни сайты wkhtmltopdf корректно генерит, а другие криво? с учетом того что верстка выглядит везде одинаково в браузерах… в некоторых случаях просто некоторые дивы не воспринимает
Некоторые сайты проверяют, кто запрашивает страницу и изменяют ее под клиента. То есть, смотрять User Agent, параметры броузера (размер экрана и тд).
Есть сайты, которые пытаются сохранить куку, и если она не принимается — выводят какой-нить рекламный блок (например, fishki.net)
Бывают проблемы, если на сайте используется java приложение, или еще какая сложная штука. Flash вообще больное место.
Но в целом, лично я wkhtmltopdf очень доволен, 95% страниц обрабатываются без проблем.
Есть сайты, которые пытаются сохранить куку, и если она не принимается — выводят какой-нить рекламный блок (например, fishki.net)
Бывают проблемы, если на сайте используется java приложение, или еще какая сложная штука. Flash вообще больное место.
Но в целом, лично я wkhtmltopdf очень доволен, 95% страниц обрабатываются без проблем.
а где картинки?
Использую php-класс mPDF как раз для подобной задачи. Не без напильника, но позволяет создать html-разметку для различного рода отчётов, бланков и т.д.
Поддерживает и html, и css. Ограниченно, но поддерживает.
Поддерживает и html, и css. Ограниченно, но поддерживает.
Я бы добавил ещё критериев:
— хедеры/футеры и номера страниц
— разделы с разными полями (не так, чтобы поля указаны в настройках на весь документ и всё тут)
— нестандартные шрифты с Unicode (часто бывает нужен фирменный шрифт)
— нормальная разбивка таблицы на несколько страниц, форматирование таблиц (рамки, цвета)
— нормальное позиционирование картинок (по скринам в статье видно, что тут не у всех гладко, а это может быть важно)
И может какой-то умеет экспортировать в RTF заодно?
— хедеры/футеры и номера страниц
— разделы с разными полями (не так, чтобы поля указаны в настройках на весь документ и всё тут)
— нестандартные шрифты с Unicode (часто бывает нужен фирменный шрифт)
— нормальная разбивка таблицы на несколько страниц, форматирование таблиц (рамки, цвета)
— нормальное позиционирование картинок (по скринам в статье видно, что тут не у всех гладко, а это может быть важно)
И может какой-то умеет экспортировать в RTF заодно?
Тоже мучался с такой же проблемой, каждый с разнообразными косяками, поэтому приходилось выбирать из наименьшего зла ;) для себя остановился на mPDF — он по-моему единственный умеет нормально делить таблицы на несколько страниц, чтобы заголовок таблицы дублировался на каждой и ячейку посередине не разрывало.
Ещё можно просмотреть TCPDF, dompdf — тоже довольно неплохие, но под мои задачи меньше подошли.
А вот поддержку widows и orphans (висящие строки в начале и в конце абзаца) вообще ни нашёл кто умеет, поэтому получается очень часто что в начале страницы остаётся одна строка с парой слов из предыдущего абзаца ;( Как это побороть не знаю, если у кого есть идеи — сообщайте, буду премного благодарен!
Ещё можно просмотреть TCPDF, dompdf — тоже довольно неплохие, но под мои задачи меньше подошли.
А вот поддержку widows и orphans (висящие строки в начале и в конце абзаца) вообще ни нашёл кто умеет, поэтому получается очень часто что в начале страницы остаётся одна строка с парой слов из предыдущего абзаца ;( Как это побороть не знаю, если у кого есть идеи — сообщайте, буду премного благодарен!
При отдаче генерируемого контента в PDF в рельсах использую prawn. Рекомендую, отличный инструмент!
prawn.majesticseacreature.com/manual.pdf Извиняюсь, не привык к отрицательной карме.
Пользуюсь xml2pdf www.alt-soft.com/Products_html2pdf.aspx, требует только .Net framework (ну или Mono, тоже работает)
Sign up to leave a comment.
Из html в pdf – легко! Обзор конвертеров