alexsphera Aug 17 2024 at 14:15

Создание плагина для распознавания текста на иврите: мой опыт и решения

3 min

3.1K

Artificial IntelligencePython *

From sandbox

Comments 9

UFO landed and left these words here

digtatordigtatorov Aug 17 2024 at 21:16

Можно попробовать автоматизировать генерацию синтетических картинок с текстом через automatic1111

Или в лоб дообучить модель SD на картинках с текстом. (SD3 уже хорошо генерирует текст). Аналог Flux

alexsphera Aug 20 2024 at 14:15

Да, классная идея. Если синтетических данных не будет хватать, то действительно можно использовать нейронные сети для генерации изображений. Но это уже после использования SynthText, который предназначен как раз для генерации данных OCR. О нем упоминал в статье: https://github.com/ankush-me/SynthText

MissPeace Aug 18 2024 at 14:10

А как же письменный иврит, от руки? 🥺Он же совсем не такой, как печатный.

UFO landed and left these words here

Conung_ViC Aug 18 2024 at 18:07

там далеко не все люди потом могут прочитать....

alexsphera Aug 20 2024 at 14:17

Письменный иврит, думаю, та еще задачка)) В нашем случае, клиенту нужно было распознавание именно печатных символов, страниц документов. Если будет кейс по рукописному ивриту -- поделюсь опытом))

javax Aug 18 2024 at 18:27

Очень не хватает деталей - как именно делался каждый из шагов

alexsphera Aug 20 2024 at 14:21

В планах расписать подробнее про непосредственно создание датасета и тренировку модели для распознавания. Подписывайтесь на ТГ, указанную в статье, буду там давать анонсы)