Как стать автором
Обновить

HABRAтопик в PDF

Я пиарюсь
Это еще не полноценный сервис, но…

Уже несколько раз проблема перевода html-страницы в pdf проскакивала в постах на хабре. К сожалению, все предложенные решения меня не устроили и пришла идея сделать свой сервис.

Так появилась "Сохраняшка".

Сохраняшка


Базовыми идеями сервиса стали:
  1. Сохранение в pdf только нужной информации, без рекламы и другой шелухи (шаблоны);
  2. Создание шаблонов pdf любого сайта;
  3. Возможность изменения размера и ориентации документа, шрифта, колонтитулов и других параметров страницы;
  4. Сохранение как отдельной брошюры, так и «книги» пригодной к сшиванию;
  5. Формирование книги из потока RSS;
  6. Возможность подключения статьи к уже существующей «книге»;
  7. Кэширование сгенерированных файлов;


На работе сервис пришелся на УРА: не приходится отдельно лазить по сайтам — каждый сайт в отдельной книге. Книги сайтов разбиты по месяцам. Каждый может распечатать или сохранить нужные страницы с книг. Даже если на сайте уже нет статьи, то вполне возможно, что она есть в книге. Новые добавления каждый день.

Конечно, пока еще не все реализовано:
В частности хотелось бы иметь книги блогов с Хабра. Они есть, но туда попали только те статьи, которые были получены с RSS после создания сервиса. Я отписался на support@habrahabr.ru с запросом о помощи по получению всех списков статей, но там молчат. Парсить отдельно весь Хабр — это решение в лоб и «некраcиво». Так что пока ждем ответа. Хотя может кто с Хабравчан подскажет идею…

Кстати по поводу идей. Хотелось бы услышать Ваше мнение/замечания/предложения по поводу сервиса.
Если сервис окажется востребованным, то выложу его полную версию в интернет (та что сейчас лежит на http://www.crysan.jino.ru/ — является тестовой, ограничена в функциональности и подвержена хаброэффекту.

Топик получился немного сумбурный но надеюсь на Ваше понимание и интерес.

P.S.
Ребята, если минусуете топик, то хотя бы в комментах отпишите, за что Вы это делаете (ну конечно если Вы не Тролль).
Указывайте в шаблоне конкретную страницу!
Не стоит также вводить в шаблон хабра другие адреса страниц, ведь один шаблон — один сайт, Вы ведь это должны понимать-то!

P.P.S.
Немного подправил код. Теперь статья выводится с комментариями. Конечно кривовато, но это на скорую руку.

P.P.P.S.
Решил некоторые указанные в комментариях проблемы. Улучшил отображение документа.

Р.P.P.P.S.
Из-за нехватки времени проект был закрыт/продан/отдан в хорошие руки.

Теги: pdfhtmlсохранение информации
Хабы: Я пиарюсь
Всего голосов 156: ↑141 и ↓15 +126
Комментарии 94
Комментарии Комментарии 94

Похожие публикации

Лучшие публикации за сутки