Pull to refresh

Comments 9

UFO landed and left these words here

Можно попробовать автоматизировать генерацию синтетических картинок с текстом через automatic1111

Или в лоб дообучить модель SD на картинках с текстом. (SD3 уже хорошо генерирует текст). Аналог Flux

Да, классная идея. Если синтетических данных не будет хватать, то действительно можно использовать нейронные сети для генерации изображений. Но это уже после использования SynthText, который предназначен как раз для генерации данных OCR. О нем упоминал в статье: https://github.com/ankush-me/SynthText

А как же письменный иврит, от руки? 🥺Он же совсем не такой, как печатный.

UFO landed and left these words here

там далеко не все люди потом могут прочитать....

Письменный иврит, думаю, та еще задачка)) В нашем случае, клиенту нужно было распознавание именно печатных символов, страниц документов. Если будет кейс по рукописному ивриту -- поделюсь опытом))

Очень не хватает деталей - как именно делался каждый из шагов

В планах расписать подробнее про непосредственно создание датасета и тренировку модели для распознавания. Подписывайтесь на ТГ, указанную в статье, буду там давать анонсы)

Sign up to leave a comment.

Articles