valeryputnin5 авг 2025 в 08:00

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Простой

8 мин

20K

Python * Искусственный интеллектПрограммирование *

Туториал

Комментарии 5

maxcat 12 сен 2025 в 12:10

подскажите, какую модель использовали для OCR русского?

valeryputnin 15 сен 2025 в 09:03

Я использовал 3.2, и это не единственная версия, которая поддерживает русский язык.

DmitriyLuckyman 20 окт 2025 в 22:54

Почему-то качество распознавания прям очень страдает.

Есть задача распознавать таблицы с показателями и значениями.

Даже явно указывая, что есть только русские слова. Он умудряется текст превращать в набор несвязанных символов, по которым даже не понять что это было изначально.

Как такое решать может посоветуете?

valeryputnin 12 ноя 2025 в 08:57

Привет. Могу только посоветовать явно указать, что считываешь русский язык и повысить качество изображения в плане количества пикселей на квадратный сантиметр и четкости изображения символов. Так же нужно выровнять текст по горизонтали. В остальных случаях это какие то исключения, для решения которых они должны быть описаны более детально.

enikeev_tg 5 фев в 03:17

Есть костыльное решение: подменить распознаваемые символы в словаре модели.
Для этого нужно залезть в папку с моделью (обычно при первом запуске модель скачивается в папку .paddlex/official_models в корне системы, у меня русская модель eslav_PP-OCRv5_mobile_rec), найти файл inference.yaml. Под ключом character_dict лежит нужный словарь. Как минимум символы греческого алфавита можно подменить на визуальные аналоги русского. Если предполагается только русский текст, то и латиницу подменить. Важно, чтобы длина словаря осталась исходной.
Либо искать альтернативные ocr-модели)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий