Как стать автором
Обновить

Комментарии 17

Попробуйте собрать корпус записей из амбулаторных карточек и натравить на это роботов.

Потому что я это разобрать не могу.
Это тоже капча. Проходят только врачи.
МедКапча должна будет говорить еще и «вроде как, да, похоже»
«Первый слой обучаемый и состоит из 600 нейронов, выходной состоит из 31 нейрона» как выбирается размер сети? Всегда интересно было
Я так понимаю, 20x30=600 пикселей буква и на этом полотне допускается 1 из 31 букв.
Я так понимаю, автор ошибся: обучаемые слои там как раз внутренний (900 нейронов) и выходной (31).
Если вы сделаете распознавалку 6-ти и 7-ми символьных капч VK с точностью процентов в 20 то напишите в личку сколько вы хотите за это решение ))
Ошибки, смайлики и упоминание VK.
Где вы нашли такую капчу у яндекса из осмысленных слов?
Заглянул в аддурилку — там вот такое:
image
На разных сервисах может быть разная капча. В поисковой выдаче, например, выдаётся осмысленная.
А за счет чего возможно повысить надежность распознования? Это количество нейронов? Количество тестовых примеров?
Как понять когда сложность сети нужно увеличивать?

Обязателен ли шаг деления на буквы, или возможно распознавать все слово?
Для распознавания всего слова потребуется количество выходных нейронов размером со словарь. Это пока даже для распределенных вычислений непосильно.
Вроде IBM делала чип на 1 миллион нейронов, который к тому же параллелился и потреблял 40 милливат. То есть мощность нейростей уже достижима вполне.
Увеличение числа тестовых примеров позволит лишь точнее оценить распознавание.
Расширение обучающей выборки, при должной продолжительности обучения, дадут 80-85% точности для каждого символа, после чего все упрется в качество сегментации.
Сложность сети увеличивается добавлением нейронов, когда прекращается уменьшение ошибки на тестовой выборке, опять же, есть 'потолок', выше которого увеличение размерности сети не приводит к улучшению её обобщающей способности.

Шаг деления на буквы НЕ обязателен, в статье о kcaptcha сеть полностью распознает капчу, минуя этот этап. Однако в таком случае требуется порядком больший размер обучающей выборки и самой сети.
Оптимальным вариантом для распознавания капч без предварительной сегментации, будет сверточная нейросеть, эту тему я затрону в последующих публикациях.
Распознали:
К сожалению, данный API более не поддерживается. Новые ключи не выдаются, а 1 октября 2015 года API будет выключен полностью.

tech.yandex.ru/cleanweb
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории