Comments 8
Кажется, в чем проблема? Закинул PDF в любом переводчике, а то и в самом браузере перевод автоматический подтягивается,
У транслятора от гугеля огрaнаничение на 300 страниц и 10Мб размер файла и, если он больше этих ограничений, тогда это не такое приемлемое решение для непосредственного применения.
А, с другими сервисами перевода ещё больше ограничений и это, если формат PDF понравится транслятору, что бывает, в силу специфики самого форматa, не всегда.
один из самых популярных форматов электронных книг - EPUB
Мне нравится FictionBook (fb) - он чем то хуже?
Не хуже, это просто факт.
мне fb не зашел, потому что мне хотелось иметь отдельные готовые странички для глав. Т.е. чтобы это были готовые html файлы.
А так - нормальный формат для текста, не хуже других.
Морально устарел. Представляет собой один гигантский xml-документ, и если книга реально большая, читалка может надолго повиснуть, читая весь документ целиком. В ePub же, если по уму, то книга делится на главы (по одной на файл) или еще как-то. Нет поддержки списков (нумерованных и ненумерованных), кода (pre/code), математических формул (если не картинками). ePub в теории поддерживает непосредственно mathml-код, хотя я не нашел читалки (бесплатной), умеющей этот код корректно отображать. В fb2 любые картинки кодируются в текст через base64, а в ePub они спокойно лежат себе как есть в контейнере (файл ePub это обычный zip-архив).
Вообще, fb2 это просто xml с определенным набором тегов, которых не всегда хватает для всех элементов книги. В ePub с этим гораздо лучше, если говорить о 3 версии стандарта. Другой вопрос — поддержка читалками ePub3.
Плюс fb2 — специальные теги для семантической разметки стихов (<stanza> и еще какие-то там).
В дополнение к вышесказанному, благодаря тому, что формат представляет из себя zip-архив, файлы книг занимают гораздо меньше места по сравнению с аналогичными fb2.
Я когда свой парсер электронных книг писал, тоже на epub остановился. Если у тебя есть html страница с текстом, там просто добавляешь ее к архиву книги. А на fb2 пришлось бы теги конвертировать.
Правда я тогда Ebook Lib не нашел, просто через jinja сделал шаблоны и заархивировал, вот тебе и epub книга.
а мне Ebook Lib не понравился
будете в следующий раз пробовать - посмотрите в сторону mkepub: https://pypi.org/project/mkepub/
он ИМХО проще для понимания и использования
«Чтение — всему голова!» Переводим электронные книги формата .EPUB с помощью Python