Comments 9
Можно попробовать автоматизировать генерацию синтетических картинок с текстом через automatic1111
Или в лоб дообучить модель SD на картинках с текстом. (SD3 уже хорошо генерирует текст). Аналог Flux
Да, классная идея. Если синтетических данных не будет хватать, то действительно можно использовать нейронные сети для генерации изображений. Но это уже после использования SynthText, который предназначен как раз для генерации данных OCR. О нем упоминал в статье: https://github.com/ankush-me/SynthText
А как же письменный иврит, от руки? 🥺Он же совсем не такой, как печатный.
Очень не хватает деталей - как именно делался каждый из шагов
Sign up to leave a comment.
Создание плагина для распознавания текста на иврите: мой опыт и решения