Как стать автором
Поиск
Написать публикацию
Обновить

Комментарии 17

Скажите пожалуйста, есть ли в FineReader такая возможность, как ограничение набора шрифтов при генерации документа?
Допустим, необходимо распознать книгу. Обычно в книгах не используют все шрифты какие только существуют, а реально пользуются очень ограниченным набором: основным шрифтом (иногда его же — жирным и/или курсивом), и шрифтами для заголовков (которые сами по себе являются отдельным элементом — то есть текст, да не совсем текст, это бы тоже нужно распознавать). Иногда еще моноширинный шрифт для кода (если книга по программированию), и т.п. Итого не более 5 шрифтов на всю книгу.
Хотелось бы, чтобы была возможность учитывать это при распознавании и принудительно ограничивать количество шрифтов, возможно вручную (какое-то окно со списком распознанных шрифтов, статистика по ним и возможность «упростить» форматирование прямо оттуда путем замены)

Да есть такая возможность.
Можно выбрать, какие шрифты использовать для распознавания (из тех, что установлены на машине у пользователя) в
Меню> Сервис > Настройки на закладке «Распознать».

http://help.abhttp://help.abbyy.com/FineReader/FineReader12/Russian/Recognition/RecOptions.htm#Fonts
Ещё есть инструмент «Редактор стилей», в нём можно посмотреть список используемых стилей и шрифтов, склеить некоторые стили в один, и поменять шрифты.

Меню> Сервис >Редактор стилей

Вы и волонтеры проделали большую работу!

По результатам этой работы получили ли вы фидбэк от волонтеров и добавились ли какие-то улучшения/фишечки в продукты ABBYY?
К примеру, стало понятно, что вот это сделано неудобно при редактировании больших объемов и в новой версии было (или планируется) улучшить?
В версию FineReader 12, готовившуюся параллельно с проектом «Толстой», успели войти замечания по процессу верификации неуверенно распознанных символов (в части Usability и в части добавления возможностей форматирования и ввода неклавиатурных символов в диалоге Проверка). Ещё в стандартном наборе языков распознавания наконец-то появился «Русский с ударениями».

Среди планов на будущее — те проблемы, с которыми столкнулись скорее редакторы при подготовке электронных книг, чем волонтеры: упрощение структуры выходного Word документа, работа со сносками и пр.
почему том 91 с указателями не дополнили гиперссылками?
было бы удобней пользоваться
что то вроде карты сайта
Все книги 90-томника сделаны в виде отдельных томов и произведений. К тому же, тома размещаются и на других площадках, а это означает, что тогда бы нам пришлось делать свою версию каждого тома для каждой из них. Кроме того, расположение книг может измениться со временем, а это значит, что и ссылки на них поменяются. Поэтому мы приняли решение не делать гиперссылки.
По «Война и мир» сразу вопрос: почему бы перевод с французского не поместить во всплывающее окно рядом с текстом? В примечании его можно оставить сколь угодно, но вот всплывающие подсказки с переводом были бы очень кстати
Весь 90-томник готовился под стандартные форматы электронных книг: epub, fb2 и mobi. Отображение комментариев во всплывающих окнах зависит не от формата, а от конкретного разработчика приложения для чтения. Поэтому, в зависимости от установленного программного обеспечения на устройстве, Вы можете видеть комментарии во всплывающих окнах, на каждой странице после текста или в конце книги.
Тексты Толстого в электронном виде представляют большой интерес для исследователей-лингвистов. Об одном из таких исследований мы надеемся рассказать вам в одной из следующих статей.

Заинтриговали. Жду.
Это супер-круто! Вот было бы здорово иметь библиотеку всей клиссики в таком же качественном виде. Да что уж там классика… Даешь всемирную библиотеку!
Поддерживаем :)
Leon Tolstoi? Имя перевели?
Это оригинальная обложка
Я конечно понимаю, что параметры распознавания диктовались конечными форматами, но почему бы ту же обложку, к примеру, хотя бы для внутреннних целей, не сохранять в каком-нибудь PDF-подобном формате, где текст подкладывается под картинку?
> формате, где текст подкладывается под картинку

Мне кажется, Вы хотели сказать DjVu, но забыли слово.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий