Обновить

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.1K
Всего голосов 4: ↑4 и ↓0+4
Комментарии4

Комментарии 4

подскажите, какую модель использовали для OCR русского?

Я использовал 3.2, и это не единственная версия, которая поддерживает русский язык.

Почему-то качество распознавания прям очень страдает.

Есть задача распознавать таблицы с показателями и значениями.

Даже явно указывая, что есть только русские слова. Он умудряется текст превращать в набор несвязанных символов, по которым даже не понять что это было изначально.

Как такое решать может посоветуете?

Привет. Могу только посоветовать явно указать, что считываешь русский язык и повысить качество изображения в плане количества пикселей на квадратный сантиметр и четкости изображения символов. Так же нужно выровнять текст по горизонтали. В остальных случаях это какие то исключения, для решения которых они должны быть описаны более детально.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации