Хабр доступен 24/7 благодаря поддержке друзей

Комментарии 9
Можно попробовать автоматизировать генерацию синтетических картинок с текстом через automatic1111
Или в лоб дообучить модель SD на картинках с текстом. (SD3 уже хорошо генерирует текст). Аналог Flux
Да, классная идея. Если синтетических данных не будет хватать, то действительно можно использовать нейронные сети для генерации изображений. Но это уже после использования SynthText, который предназначен как раз для генерации данных OCR. О нем упоминал в статье: https://github.com/ankush-me/SynthText
А как же письменный иврит, от руки? 🥺Он же совсем не такой, как печатный.
Очень не хватает деталей - как именно делался каждый из шагов
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Создание плагина для распознавания текста на иврите: мой опыт и решения