Странное дело, всё чаще диссертацией норовят назвать то магистерскую работу, то вот уже и бакалаврскую (автор статьи — «Mr. Ben Boyter, a Bachelor of IT»). При этом саму степень почему-то не уточняют, так что даже 30-страничная курсовая работадиссертация третьекурсника прозвучит не менее внушительно, чем докторская…
Там просто одно слово на всех. Но именно поэтому обычно таки уточняют степень — bachelor thesis, master thesis, phd thesis. Cтранно, что в статье этого не сделано.
Не только у «буржуев». В этом году в российском вузе я защищал магистерскую диссертацию. У бакалавров дипломная работа носит название «выпускная квалификационная работа».
На самом деле рекапча бывает порой намного хуже этого. Сделать хоть что-то можно понять. Я прочитал — DDNTWW. А теперь попробуйте разгадать второе слово на рекапче
кстати да, я регулярно встречаю в рекапче такие артефакты. Они напоминают криво вырезанные фрагменты отсканированных текстов. Возможно, баг при обработке исходных материалов для капч.
Ради интереса перевел в гугле эти первые четыре буквы, получилось: חברת = company = компания.
Можно сделать вывод, что Хабрахабр с иврита переводится, как Компания компаний (или Сообщество сообществ)
мой последний опыт с такой капчей убил у меня всякое желание рагистрироваться на ресурсе. Я потратил несколько минут на борьбу с ней, постоянно обновляя её, чтобы наконец-то найти читаемую для человека!
Я использовал на своем ресурсе такую капчу пару недель. Это не останавливало ботов.
Тогда я заменил капчу вопросом из серии:
«вода, земля, воздух, огонь, мороженое» — какое слово здесь лишнее.
и ботов больше не регистрировалось. Только люди. :)
Я думаю, что для ботов будет достаточно скрытового поля, при заполнении которого они палятся. Тут смысл другой — предотвратить атаку на конкретный сайт, но в таком случае капча все равно не помогает, т. к. есть сервисы подобные антигейту
О смысле таких капч предлагаю посмотреть следующую TED-лекцию. Одно — «понятное» — слово сгенерировано для стандартной проверки на робота. Второе — является частью работы по оцифровке книг. Его не распознал компьютер, можете не расшифровать и вы, так что достаточно ввести хотя бы первое слово. Смысл в том, что попадаются и более ясные случаи, и если несколько пользователей одинаково распознали такой отрывок, этот вариант и принимается как исходный текст.
+100. Бывает, что вроде и выбрал, что полегче, ввел текст — а тебе говорят — «Неправильно!». Я тут на днях минут 10 боролся с такой капчей. Раз двадцать рефрешил текст, раз 5-6 вводил. Пока зарегистрировался — забыл уже, зачем я на тот сайт рвался-то…
В общем, эта система себя изживает, ИМХО. Надо придумывать что-то принципиально другое для отсева ботов.
Автор статьи не я. А насчет объема текста — думаю, что автор хотел объяснить как это делается для новичков и те, кому это интересно развивались дальше.
в общем-то, весь процесс распознавания капч можно разбить на этапы:
1. удаление шума и искажений
2. бинаризация (удаление лишней информации: цвет, фон...)
3. сегментация (разделение на отдельные символы)
4. распознавание символа
и у каждого этапа есть свои трудности и для различных капч могут подойти различные методы. универсальным методом, к сожалению, остаются только «индусы»
Все это круто, но на практике мало кто применяет такие подходы, а используют сервисы типа antigate.com в своих ботах/парсерах. Дешевле платить $1 за 1000 капч, чем день, если не больше, работы программиста по анализу и реализации алгоритма взлома капчи.
Здесь всё довольно просто.
0. Бинаризация.
1. Символы хорошо разделены, шумы незначительны; сегментация не вызовет проблем.
2. Можно выделить контуры символов и по ним делать распознавание.
3. Шрифт одинаковый, размеры символов неизменяемы, повороты незначительны. Поэтому можно использовать нейронную сеть.
Во-первых, никакие формулы зубрить здесь не нужно. Под корнем, очевидно, находится бесконечно малая в точке функция (т.к. произведение ограниченной и бесконечно малой). Корень, соответственно, тоже будет бесконечно малой функцией. Значит, под логарифмом стоит сумма константы и бесконечно малой функции, откуда предел равен ln 2. Где здесь хоть одна «вызубренная формула»?
Признаю — ляпнул не глядя. Матанализ не трогал с первого курса — успел все позабыть (были у меня сложности с организацией учебного процесса тогда + не очень люблю его).
Средняя школа — к тому, что чем старше, тем менее хочется считать руками. В школе быстро перемножал многозначные числа в уме — сейчас медленно и предпочту калькулятор. Да, может тренирует мозг — но я не считаю что быстро считать чем-то ценно в ХХI веке.
@Norvind не стоит оно этого, даже для технарей. Можете смело распрощаться с посетителями вашего сайта с такой капчей, ну если конечно он не сугубо профильный (математический)
Декодирование капчи на Python