Pull to refresh
0
0
Send message
когдато пришлось заниматься подобным вопросом, моей задачей было поддержание распознования текстов с ироглифами и tesseract справлялся с этой задачей лучше других. Даже коммерческие продукты такой поддержкой не удасужились, либо с низким качеством распознования. Правда, это было лет 5 назад и возможно сейчас все по другому.
И вот насколько помню, тессерак предоставлял несколько опций распознования, построчно, побуквенно, всем текстом. И почемуто временами распознование всего текста было качественней чем побуквенно (это я о обычных буквенных языках), но если циклично проганять текст через построчную и побуквенное распознование, то качество улучшалось. А вот применение OpenCV для предподготовки изображения особой эффективности не давало, так как тессерак сам проводит подобную подготовку перед распознованием.
идея с предизучением очень крутая и главное простая в реализации.

Information

Rating
Does not participate
Registered
Activity