слабо. Автор плохо представляет себе, что в его шумах дейстивтельно мешает распознаванию. Либо не может сделать ее при этом читабельной.
Начать надо с того, что удалить все цельносвязные объекты одного цвета, с весом меньше Х.
Останутся только настоящие буквы и полоски фона, которые будут сильно отличаться топографически. Все, буквы есть, в почти нетронутом виде
ну это конечнго если у тебя как раз завалялось пара суперпосещаемых порносайтов и ты готов пожертвовать их юзабилити. То есть по итогу это стоит ничуть не дешевле.
Нейронной сети, в целом, все равно - цела ли буква. Главное, чтобы она была на входе, и желательно, чтобы ничего кроме нее там не было.
Понять, какая часть от какой буквы будет, конечно, нелегко, однако надо посмотреть на то, как это будет выглядеть - возможно при таком условии и человеку будет слишком сложно прочесть.
В общем, говорить, конечно, интересно, но пока нет картинки - это просто разговоры.
Распознавать символы сравнивая с шаблонами - не самый лучший вариант. Нейронные сети гораздо эффективнее.
Если удастся выделить отдельные буквы (пусть и порубленные на кусочки) - задача почти решена.
А, пардон, протупил.
Идея интересная. Не самая легкая для распознавания, безусловно.
Правда из-за специфики способа отображения букв не удастся ставить из слишком близко друг к другу (не прочитать), так что можно будет попробовать вычислить положения букв по проекциям.
Не уверен, надо пробовать.
Начать надо с того, что удалить все цельносвязные объекты одного цвета, с весом меньше Х.
Останутся только настоящие буквы и полоски фона, которые будут сильно отличаться топографически. Все, буквы есть, в почти нетронутом виде
Ну и что что ровный текст. Что дальше?
Понять, какая часть от какой буквы будет, конечно, нелегко, однако надо посмотреть на то, как это будет выглядеть - возможно при таком условии и человеку будет слишком сложно прочесть.
В общем, говорить, конечно, интересно, но пока нет картинки - это просто разговоры.
Если удастся выделить отдельные буквы (пусть и порубленные на кусочки) - задача почти решена.
Идея интересная. Не самая легкая для распознавания, безусловно.
Правда из-за специфики способа отображения букв не удастся ставить из слишком близко друг к другу (не прочитать), так что можно будет попробовать вычислить положения букв по проекциям.
Не уверен, надо пробовать.