Как стать автором
Обновить

Комментарии 39

Давно ждал! 3837 закладок потянет?)
О каких закладках идет речь?
НЛО прилетело и опубликовало эту надпись здесь
Все верно, об избранном
На даный момент пакетного экспорта нет, но возможно позже добавлю.
Только стоит учитывать, что экспорт на даный момент не очень быстрый. Страница с Хабра может экспортится 5-10 секунд, в зависимости от размера статьи и количества изображений. Поэтому экспорт 3000 статей может занять 5-10 часов. Я конечно буду оптимизтровать код, но вряд ли это сильно ускорит экспорт.
Книги с Самиздата тоже могут долго конвертироваться. Экспорт документа на 900к у меня занимает около 12-15 скеунд.
Тоже думал об этом, но не был уверен в необходимости такой возможности. Должно быть не очень сложно добавить. На выходных гляну.
Было бы очень славно. Только отсутствие данного функционала останавливает меня от полномасштабного использования.
у меня первая мысль тоже была о комментариях.
Хабр такое редкое место, где комментарии могут оказаться интереснее и полезнее самой статьи.
Обновил расширение. Добавлена возможность сохранения комментариев и некоторые другие улучшения. Смотри апдейт в конце статьи.
Спасибо добрый человек!
Почему-то не работает. «Converting to 'fb2'...» и тишина. Может, что не так делаю?
Аналогично.

В консоли пишет:
Port error: Could not establish connection. Receiving end does not exist. 
miscellaneous_bindings:236

chromeHidden.Port.dispatchOnDisconnect 
miscellaneous_bindings:236

Uncaught Error: Attempting to use a disconnected port object 
miscellaneous_bindings:58

PortImpl.postMessage 
miscellaneous_bindings:58

listener.handleEvent 
page_action.js:79

А можно указать браузер, его версию, а также страницу (сайт), на которой не работает?
Как я уже говорил выше, это только ранняя версия и возможны глюки. В часности, есть проблемы при работе в Хромиуме, с которыми пока не разобрался.
Windows 7, Chrome Version 25.0.1364.172 m, эта страница
Странно. У меня сохраняется. Только у меня Линукс и версия 26. Может в этом проблема. Надо смотреть.
Обновил хром до Version 26.0.1410.43 m — проблема исчезла. Спасибо за расширение, кстати!
Ubuntu, chrome 26, текущая страница, не работает.
Ха, хром обновился утром, но, видимо, не перезапускался. Перезапустил — заработало :)
Ога, у меня на такой конфигурации тоже не работало с такими же. Обновился до 26-ой версии хрома и все заработало.
Автору огромное спасибо. До этого пользовался самописным конвертером самиздата в fb2.
Если принимаете фидбэк, то вот мои скромные 5 копеек:
1. при конверте самиздата в получившийся fb2 пришлось добавлять руками <?xml version=«1.0» encoding=«UTF-8»?>
2. неплохо бы сделать так, чтобы файлы с самиздата нызывались не просто book.fb2, a например <title страницы>.fb2

1. Добавлю.
2. Планирую добавить генерацию корректных имен файлов для всех сайтов.
Сделано. Смотрите апдейт в конце статьи.
При конвертации этой страницы: нумерованные списки криво преобразуются — текст слипается в одну строку.
Вижу. Это из-за отсутствия поддержки тега ol. Вечером добавлю.
Насколько просто/сложно добавить поддержку других сайтов?
Например архивов популярной механики? (popmech.ru)
Сейчас мне это надо делать вручную. Для даного конкретного сайта думаю пару часов, включая тестирование и деплой.
Я бы не был столь оптимистичен. Последний раз, когда я делал грабилку этого сайта, я был поражен ублюдочностью верстки внутри. Может что-то поменялось к лучшему за последние пару лет.
Если говорить о самой процедуре добавления поддержки, то она состоит из 2х шагов:

1. Создать настройку для нового сайта в виде JSON-конфигурации. Вот как она выглядит для Хабра:
habr_article = {
    addr: ['http://habrahabr\\.ru/post/\\d+', 'http://habrahabr\\.ru/company/\\w+/blog/\\d+'], // pages url template
    formatters: {
        fb2: { xsl: 'chrome|../pages/habr2fb2.xsl' },
},

В addr задаются RegExp-ы для фильтрации адресов, поддерживаемых даным конвертером.
В formatters описываются форматеры и их данные поддерживаемые для указаных адресов.

2. Параметр xsl в formatters.fb2 задает XSLT преобразование. Шаблон этого файла можно глянуть тут, а реализацию для Хабра тут.
Во время конвертации этот файл встраивается в fb2.xsl.

В дальнейшем хочу сделать добавление этих данных в панели опций.
В общем понятно, это тулза для «правильных» сайтов, фактически только для xhtml.
Не только для xhtml сайтов, для обычных тоже. Внутри производится конвертация из html формата в xhtml.
И элементы, элементы. Вот что было бы здорово.
Userscript в хроме проще некуда ставить, легче даже, чем в огнелисе. Не понятно с чем проблема?
Последние версии Хрома не поддерживают прямую установку. Надо пользоваться посредниками навроде Tampermonkey. Во вторых, с отладкой были какие-то проблемы, сейчас не вспомню. Ну и напоследок, встраивание в панель Хрома и меню опций проблематичней сделать, чем в родном расширении. Есть конечно GM_config, но он намного бедней по возможностям в сравнении с pageAction.

Но, возможно, я просто не очень хорошо разобрался с разработкой userscript'ов. Как доделаю текущий вариант, гляну на userscript.
Спасибо за конвертер. Этот топик красиво законвертило, но вот, например, для habrahabr.ru/post/138666/ и habrahabr.ru/post/140012/ выдаёт пустые книги. Т.е. внутри xml правильный на первый взгляд, заголовки заполнены, но контента нет.
Поправил. Обновитесь.
Очень нужный и полезный конвертер.
Но почему то не вижу картинок в экспортированных файлах, например, вот текущая страница…
Fedora 17, Google Chrome 26.0.1410.43.
FB2 смотреть пытаюсь FBReader'ом под этой же Федорой.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации