Сохранить HTML страницу как PDF, JPEG

    Приветствую сообщество. Думаю я не первый и не последний, перед кем встал вопрос, как же сохранить html страницу в pdf или jpeg формате. Ситуация простая. Разрабатываем crm, есть генератор документов для документооборота. Генератор, соответственно, всего на всего html шаблонизатор, адаптированный для документации. Короче говоря на выходе имеем html. Система сама рассылает заявки производителям, письма партнерам итп. Отправлять их в html виде совершенно не целесообразно, в pdf или jpeg самое оно.
    Стандартные консольные средства конвертации html во что-то более «печатоудобное» не подошли. Это и понятно, верстка многих документов достаточно специфична и в любом случае без процессора (в нашем случае браузера) не обойтись. Было опробовано куча соответствующего ПО и модулей. От php скриптов до консольных приложений. Ближе всех оказался dompdf, однако он не был идеальным + частенько сбоил, что в нашем случае недопустимо.

    В итоге пришли к решению, что ничего не остается, как брать виндовый сервак, ставить его в нормальный ДЦ, поднимать там фаерфокс итп и делать сервис.
    Уважаемые знатоки, внимание вопрос :) Не изобретаем ли мы велосипед? Может кто знает такой сервис, куда денежков заплатил, а на выходе из html получаешь копию firefox-like но уже в jpeg и pdf?

    p.s. соответственно советы и способы типа «а ты сверстай документы не firefox-like, а как понравится консольному софту» не годятся, т.к. речь именно о достаточно простом генераторе документов. Не заставлять же каждого пользователя crm учить особенности рендера того же html2ps, а с вёрсткой под великую тройку справится и начинающий верстальщик.
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 18

      0
      думаю, можно прикрутить к вебкиту модуль для скрина экрана.
        0
        firefox более популярный, быстрее набирает обороты и для него уже есть модули конвертации и в pdf и в jpeg/png/gif/etc. Да и выбор процессора дело второе =) первое — понять нужно ли делать свой сервис.
        0
        онлайн сервисы для снятия скрина в джпеге видел, а вот в пдф — нет
          –1
          jpeg перегнать в pdf очень легко :)
            +3
            Это как вставить скан документа в ворд, ага.
          0
          Уважайте своих партнёров, не рассылайте им многомегабайтные скриншоты, а тем более скриншоты текста в JPEG. Напишите шаблонизатор для PDF, это не так сложно (LaTeX...)
            +3
            скриншот этой страницы
            FF+Fireshot дефолтные настройки
            png = 36 Kb
            jpg (q90) = 88Kb

            0
            А если, перед тем как скормить креатив пользователей html2ps'у, прогнать его через html tidy c соответствующими опциями?
              0
              Опять же, это было бы решением, если бы не потребность в кривом, косячном и совсем не валидном html и css коде, который нормально хавает firefox и запинаются другие рендеры =)
                0
                Ну, по идее, tidy должен на выходе выдать валидный хоть html, хоть xml. Вариант с имиджами мне тоже кажется не слишком удачным — из них невозможно скопировать текст, например.
                  0
                  речь о jpg+pdf, а не про только jpg. тиди сделает валидным html, но не css. Да и никак не поможет html2ps отобразить этот самый css.
              0
              Вот linux тулза:
              www.guangmingsoft.net/htmlsnapshot/html2image.htm

              Support using mozilla gecko (firefox) to render html to image

                0
                ололо фиван, ты предлагаешь ставить на линуховском сервере иксы, виндовые шрифты и юзать платное по, чтобы получить картинку из html с помощью firefox? =) я лучше виндовый сервер арендую, дешевле получится =)
              0
              Ох писал же я статью по этому поводу: habrahabr.ru/blogs/development/30018/#habracut
                0
                И да, в последней версии wkhtmltopdf уже не требуется Xvfb
                0
                А дописать ваш генератор документов для документооборота, чтобы он генерил паралельно ХТМЛ и ПДФ нельзя?
                • UFO just landed and posted this here

                  Only users with full accounts can post comments. Log in, please.