Pull to refresh
5
0
Send message

>>Но там было фиксированное количество символов, с реальными словами все гораздо >>сложнее.

Не совсем понял в чем сложность с распознаванием реальных слов, даже без словаря. Есть выборка капч, исходя из нее мы находим параметры для модели в том числе и количество классов - используемые символы, максимальная длина текста на капче. Дальше как раз не самому распознавать капчи, а отдать в сервис, где люди руками вам разметят выборку. Все ингредиенты есть, начинаем обучать, получаем модель с неплохими показателями правильных ответов, хочется больше, берем выборку побольше.

Скорее хочется услышать, как должна выглядеть текстовая капча, которая будет сложна в распознавании, таким простым методом(CNN+LSTM) в том числе. В статье я обозначил ограничения, на чем эта сеть спотыкается.

В контексте яндекс капчи, думаю стоило добавить для сравнения и этот подход.

Но сеть CNN+LSTM хорошо справляется с распознаванием слова целиком. Я хотел рассказать общий подход к распознаванию, не только яндекс капчи, а в случае детектора отдельных букв в капчах с упором на сложность сегментации, типа старых капчей гугла

CRAFT может хорошо и не сработать, а вот сеть CNN+LSTM сработает на все 100, мы получим уровень распознавания близкий, или лучше человеческого. К тому же, после крафта нам надо вырезать символы, собрать базу, почистить, обучить классификатор, а в случае CNN+LSTM просто пьем кофе и ничего не делаем.

Все что связанно с вопросами, кроссвордами и тд., является выборкой не очень большого размера и в итоге все ответы можно собрать и это будет не юзер френдли.

Много лет назад подобные капчи с вопросами использовались, когда они получили распространение, то боты легко их начали обходить.

Жаль, большое поле для апгрейдов было, плюс заменить в случае поломки можно было самому без сервиса.

Для каждого проца будет свой ключ, или я могу дать его соседу у которого такой же проц, и он тоже сможет активировать фичи?

Если я продаю проц на вторичку, теперь нужно будет заморачиваться с ключем, и отдавать еще флешку на которой записан ключ?

Особенно это касается вторички, серверных процов(видимо интелу не дает покоя слава V3 и V4), когда время приходит и ДЦ сливают свои процы по низким ценам, то теперь это будут просто болванки с небольшой производительностью, без ключа никому не нужные?

Надеюсь АМД не будет страдать такой фигней и еще больше сожрет рынок, потому что с такой "фичей" процы малопривлекательны, особенно, если окажется, что за это придется платить помесячно.

Цена доставки должна зависеть от расходов на эту доставку, которая определяется габаритом, весом и расстоянием. Должно быть что то типа такого максимальные размеры Х на У весом не более N грамм цена Z

Все шумы в данных, типа как повороты, макияж, маски с различными рисунками, работают если система не обучалась на похожих данных. Как только об этом написали, или все начали использовать, то и база данных прирастает примерами из этого распределения и все это больше не работает.

18 ядерники видел по 240 баксов, с анлоком турбобуста неплохое решение.

Все же, для быстрой работы с большими файлами нужно было взять PCI-e диск, в процессе работы вы точно почувствуете разницу против sata диска.

Information

Rating
Does not participate
Registered
Activity