Как стать автором
Обновить

Комментарии 38

Очень хотел купить 9" e-ink для чтения документации (в основном оракловой). Отказался от покупки из-за того, что даже на таком экране оракловые PDF`ки выглядят нечитабельно.

У меня огромная просьба к Вам: прогоните, пожалуйста, через свой скрипт, например, вот этот документ download.oracle.com/docs/cd/E11882_01/server.112/e16638.pdf (великоват, да) и выложите скрины 72-ой страницы (она же 4-9). Найдите, пожалуйста, время. Может, я после этого всё-таки передумаю и куплю. Достали уже кипы бумаг во всех углах :)

PS: не стал писать в личку, т.к. читателям тоже может быть интересно посмотреть на результат.
На 9" даже с разворотом плохо видно?
Видно-то хорошо (для глаз). Только полезной информации влезает очень мало. Неудобно работать с документом. Расстройство одно.
Думаю, вы существенно упростите задачу автору если выдерните самостоятельно именно те страницы, которые вас интересуют. Например, с помощью утилиты pdftk
ой, какая хорошая утилита, спасибо. Автор может взять отдельно выдернутую страницу по ссылке zalil.ru/31859635
ок, сейчас пока ни ридера, ни линукса под рукой нету, как доберусь домой — проверю и выложу
Что-то как-то не очень получилось, не?
И размер с 42 увеличился до 317-ти кб.
извиняюсь за качество изображений, вечер, вот как-то так получилось:


Спасибо, для шести дюймов это, по-моему, просто супер. Если обрезать колонтитулы, то будет совсем хорошо.

Ещё одно отдельное и огромное спасибо за то, что открыли мне глаза. Оказывается, с июня месяца вся оракловая документация доступна не только в html и pdf, но также в mobi и epub. Скачал, завтра пойду в магазин проверять.
Для обрезания колонтитулов идеально подходит Briss.
Можно обрезать в скрипте так же, перед обрезкой, мне приходилось как-то это делать, когда покупал книги на books.ru они одно время в книги вставляли колонтитул в самом верху что эту книгу купил такой-то и такой-то, проживающий по такому-то адресу, я у них просто покупал еще и бумажные книги и вся информация обо мне там у них была, сейчас вроде когда покупал последнюю книгу такого больше не было.
Вот как можно обрезать колонтитул, не универсально правда, нужно подобрать сначала размер будет:
...
# отрезаем колонтитул
convert -gravity South -crop 100%x85% +repage $p $p

# обрезаем все поля автоматически
convert -trim +repage $p $p
...
На Kindle DX эта страница отображается на ура.
касательно оракловских док, что мешает их скачать в mobi или epub форматах?
Спасибо, интересно!

Думаю, что было бы круто добавить настроек и сделать это web-сервисом. Представляется, что нашлись бы сочувствующие.
довольна тяжёлая операция, поэтому это несколько проблематично будет думаю, вот сделать вариант для windows думаю можно, все используемые инструменты существуют и под windows, а линукс конечно все таки не так много у кого есть
было бы отлично, если бы кто-то сделал подобное под виндовс
НЛО прилетело и опубликовало эту надпись здесь
Может не совсем в тему, но мне вот это несовсем понятно:
«Бытует мнение, что на электронных книгах с e-ink дисплеями, можно комфортно читать только текстовые книжки, где можно выставить большой шрифт»
Что вы понимаете под «большим шрифтом»?
для текстовых форматов можно выставить любой шрифт, любого размера, какой вам будет комфортен, так что под «большим» я понимаю — комфортный, который легко можно читать на расстоянии вытянутой руки, не прибегая к помощи увеличительного стекла :)
Я не понял, на выходе получаются картинки порезанные, или распознанный документ? Знаю софт, который переводит сначала в картинки, а потом их режет. Но мне такой вариант не подходит, потому как в Киндле использую словарь англ-русс, и вариант с картинками не годится.
Да, картинками получается.
в киндле есть Duokan
Есть. Но, насколько я помню, если читать через эту прошивку не-pdf книги, то русские шрифты выглядят коряво. А постоянно переключаться между Duokan и стандартной прошивкой нет никакого желания.
Правильным решением все же было бы распознавание текста и чтение его потом с reflow. Не вижу особой проблемы в этом, картинки в тексте сохраняются.
и как сваять такой скриптик?
скрипт не нужен, finereader.abbyyonline.com и иже с ними
ага, а что на счет djvu с текстовой подложкой?
а что насчет него? он поддерживается
ага и 10 баксов за 200 страниц. Смысл тогда электронных книг? =)
ммм, слабо вижу это как замену моему покетбуку на 9,7"
по поводу размеров файлов:
djvu в 10Mb конвертируеться с помощью ddjvu в 19Mb pdf. тут размер растет из-за того, что jpeg, из которого состоит новый pdf, несколько менее приспособлен для хранения монохромной инфы (вообще то никак).

Если пропустить книгу через Ваш скрипт, то размер pdf возрастет до 108Mb. Но тут уже jpeg не причем.
Вы каждую четвертушку увеличиваете до 800x600 — 800*600*4 => 1920000
В то время как размер исходной страницы djvu или pdf'а через ddjvu — 485x685 (485*685 = 332225)
1920000/332225 ≈ 5.8
19.2 * 5.8 ≈ 110Mb

Так что тут особо размер не уменьшишь
djvu не собирает. также неплохо бы убираться за собой, но скрипт такого не умеет
спасибо, действительно не собирается, просто не первая версия скрипта, и djvu давно им не собирал, исправил и добавил удаление всех временных файлов
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
djvu out + png ==
Not a JPEG file: starts with 0x89 0x50
*** [1-14410] Unknown PPM file format.
*** (JPEGDecoder.cpp:166)
*** 'static void DJVU::JPEGDecoder::decode(DJVU::ByteStream&, DJVU::GPixmap&)'
что я делаю не так?
Прошу прощения у автора, но кажется предлагаемый метод не очень хорош в плане конечного результата. Поясню: пробовал скрипт в исходном виде, пробовал менять параметры разрешения и количество фрагментов на которое надо разделить страницу — всё бестолку. Шрифт «плывет». Читать можно, но только в горизонтальной ориентации (вертикально совсем плохо) и то глаза устают. Решил погуглить и нашёл таки идеальное решение.
Делюсь
_https://www.willus.com/k2pdfopt/download/

Не сочтите за рекламу. Программа бесплатная, есть версия под винду. Лично я от результатов в полном восторге!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории