Как стать автором
Обновить

Комментарии 121

Соглашусь что выглядит она ужасно. Я не специалист в UI, но билеты на этом портале покупаю регулярно. Так вот я ни разу не задерживался на данной капче больше 5-10 секунд. По личному восприятию прочесть и сделать два-три клика гораздо быстрее разглядывания набора символов, не предназначенных для чтения, с последующим их набором.

Добавлю что, из-за блокировки Гулга знаменитая reCAPTCHA либо не работает, либо имеет долгий отклик при использовании обходных каналов.

С другой стороны, капча введена не для удобства пользователей и я согласен на ввод такой капчи чтобы купить билет по его цене в интернете, нежели покупать с наценкой у перекупщиков (а цена для иностранца всегда отличается).
Мм, ну у перекупщиков (ctrip да alitrip) цены такие же, главное вовремя снять галочку с покупки «доп.страховки». И национальность значения не имеет :)
Ну как сказать. В c-trip обязательно надо заплатить 20-40 юаней дополнительно, но они как бы остаются на счету и могут быть использованы для бронирования отелей через них. Надо полагать, большинство забивает на эти деньги, а если отели и бронировать, то, возможно, это будет дороже, чем через другие системы.
Не, теперь уже можно выбрать пунктик «мне не нужно ничего, дайте только билет».
Хорошо, если так, но я вот сейчас попробовал дойти до оплаты и никаких галочек увидеть не смог
А, судя по всему на китайской версии их сайта можно купить без добавки. На английской такого не предлагается
Думаю, — это неплохой вариант для китайского языка.
Представьте только капчу из искажённых и размытых иероглифов да ещё и перечёркнутых случайными линиями!
Это же будет вообще за гранью добра и зла.
В английском алфавите всего 26 букв и то reCaptcha не всегда с первого раза разгадывается. А что будет, если 'букв' будет тысячи?
В каком-то смысле, проще:
image
да вроде ничего сложного, даже для меня не знающего китайский:
林暗草涼风
Шерлок, но как??
Ну, я когда разгадывал аналогичную капчу на сервисе проверки серийника xiaomi пользовался гуглопереводчиком с рукописным вводом (правда удавалось далеко не с первого раза угадать все символы)
Ха, я забил на это не благодарное дело и через некоторое время нашел таки англоязычную версию сайта с возможностью проверки серийника. Вам несомненно респект за упорство :)
Добавлю, что можно ещё им на какой-то e-mail по-английски написать просьбу проверить подлинность товара с их брендом
Поделитесь, зачем нужно проверять серийник xiaomi? Чтобы точно знать, что это не подделка?
Обычно не серийник проверяют, а специальный код под скретч-слоем на упаковке. При каждой проверке на сайте отображается, валидный ли он, и сколько раз такой код уже вводили.
Да, конечно же я имел ввиду код под защитным слоем ;)
А что мне мешает положить подделку в оригинальную коробку? :)
Ну собственно ничего для единичного случая ещё можно, а для продавца вопрос где взять столько оригинальных коробок и что потом делать с телефонами в неоригинальных коробках.
в иероглифах важно направление написания отдельных «ключей» — элементов в них. А так же важен порядок написания самих ключей.
А так же некоторые ключи очень одинаковые.
Например:
image

В японском например даже в слоговой азбуке есть такое: シツシツシツシツシツシツシツシツ и ンソソソンソソソンソソソンソンンンソソン — в каждом блоке по две РАЗНЫЕ буквы. Разница только в направлении рисования длинной линии, сверху вниз или снизу вверх. А так как это азбука для взаимствований из англ и прочих языков то очень важно на глаз сразу видеть что это СО или Н, СИ или ЦУ, т.к. заимствуют англ слова с сильными сокращениями как и мы например «комп» (パ) и разница между ними порой только в одном слоге. А эти короткие палочки одна или две порой не различаются никак вообще или вообще заменены на точки, гругляшки, квадратики, кошачьи лапки и кто во что горазд, особенно в вывесках, меню и прочем декоре.
Это же просто улыбочки, ну что вы в самом деле ツ
Да, и улыбочки одноглазого ン.
… да что такое, картинка не вставляется…
http://2.bp.blogspot.com/-YdmSpUk52vU/UqGpbRbGprI/AAAAAAAABjE/r894FUykm3w/s1600/47.png
Карма отрицательная, а т.к. нет публикаций, то и поднять её невозможно. Держите:
понял. Спасибо
На мой взгляд справа 20 абсолютно одинаковых символов. Как они умудряются отличать их друг от друга, и главное как это различают распозновалки текста?
различить можно в сочетании смысла и стиля написания и типографической формы, визуально они отличаются если правильно написаны, ключ к правильному написанию — направление кисти / карандашаручки
например
image
image

а насчёт распознавания даже хз, тут совсем другого плана задача нормально не решена:
у них нет пробелов, а типографские точки тире и тд уже в шрифте пробелами отделены и представляют единый символ, и поэтому отличить слова друг от друга можно только понимая смысл, что требует ИИ, а его нет.
Как в итоге проги переводчики текст разбить на слова редко когда могут нормально даже в пределах одного абзаца, а порой предложения. Правил которые бы отделали слова друг от друга тоже вообще нет.
Ну и есть такая шикарная штука как куча исключений и выпаданий из правил, которые кстати нередко используются и правил использования слов нарушающих правила сотни — их надо просто все знать и на практике об каждый мозг разбить не раз.
краткий пример сюрпризов
Поэтому у них старательность и тщательность к деталям возведены на не досигаемый уровень но системный подход очень страдает.

Ну и словарный запас реально в сотни тысяч, мне реально не хватает ejje.weblio с почти миллионом. Я веду свой словарик в ворде где у меня выписаны все слова новые которые я повторяю, через пробел, там много тысяч страниц, повторов обычно меньше 3-4 и то через лет 5 порой. Могу провести его датамайнинг кстати, но будет ли интересным это?
Будет-будет.
Если не хотите на публику, с удовольствием пообщался бы лично с Вами.
богатый опыт чтения фанатской манги с мелким текстом от руки, после ксерокса в мелком томе размером с А5
Пожалуй, нет. По собственному опыту скажу, что иероглифы на типичных капчах распознаются попроще букв.
Нет проблем типа I/l, q/g, i/j, a/d, o/0 и т.д.
Мне кажется с латинскими буквами у большинства туристов, не знающие местные иероглифы, больше шансов даже с типичными проблемами в схожести букв. Понимаю что весь сайт может быть в иероглифах, но там хотя бы каким переводчиком онлайн(?) можно воспользоваться, а тут просят указать то чего нет даже на твоем лэптопе. Другими словами если завтра сделают англ версию для туристов, а капча так и останется, вот это будет взрыв полный. Было бы здорово, если бы можно было выбирать альтернативный набор символов, а еще лучше это все в опенсорс продукт, чтоб все могли пользоваться, а не как онлайн-сервис той же reCAPTCHA.
Да, кошмар. Мы же тут программисты, надо написать скрипт, который будет решать такие каптчи… Oh, wait…
А как, простите, скрипт тетю от дяди отличит?
Я не понял о каких тётях и дядях идёт речь, но, в любом случае, простите за слишком тонкую (и явно не уловленную сообществом) иронию в моём первом комментарии.
Имел ввиду скрипт, который каким-то образом должен различать людей по полу, если ему, например, предлагается выбрать девушек на картинках.
Да нет, ирония в целом понятна, скорее всего заминусовали так как очевидно, что этот скрипт писать просто бессмысленно, так как по вышеперечисленной мной причине эта капча после гугловской на куках является практически непробивной, особенно если ограничивать попытки по IP и ожиданием после нескольких попыток минут пять — это уведет время ее распознавания практически в бесконечность.
что этот скрипт писать просто бессмысленно, так как по вышеперечисленной мной причине эта капча после гугловской на куках является практически непробивной

Эээ, почему вы так считаете? Задача определения пола относительно простая для машинного обучения (по сравнению с поиском произвольного объекта). В конце концов, есть же сервис how-old.net, достаточно скармливать ему нужные фотки и получать пол с большой вероятностью (конечно, у how-old.net скорее всего есть какая-то защита от ботов, но её всегда можно обойти, например банально запуская скрипт из браузера и польностью имитируя действия пользователя).
Да, только не стоит быть таким оптимистичным. При всем своем развитии самообучающиеся системы — это пока все еще что-то из раздела робототехники. В этом направлении уже сделано очень много, соглашусь, однако над ними еще работать и работать, чем точно не будут заниматься создатели спам-ботов.

P. S. how-old.net определяет пол и возраст, перебирая миллиарды фоток и сравнивая черты лица. Однако определить что-то более абстрактное, не имеющее каких-либо параметров, пока невозможно.
И в том-то и дело, что можно и скриптом все кликать, ну дак так и крупные ресурсы ддосят, нанимая армию доноров. Но речь-то идет об относительно обычных юзерах и ботах, от котрых она помогает на 99%. А в остальных случаях можно и БД взломать и оставить коммент насильно, если уж так хочется, чего уж там)
Причина одна — только 45% населения владеют унифицированной письменностью, а диалектическая слишком разная и её слишком много
НЛО прилетело и опубликовало эту надпись здесь
А нормальные картинки очень быстро начнут распознаваться машинами.
НЛО прилетело и опубликовало эту надпись здесь
ищешь много и странно — видишь капчу

Тут есть грабли: не так сложно и дорого сделать так чтобы каждый запрос шел от своего ip адреса со своим user-agent'ом, многие сервисы предлагают прокси сразу с большими пачками ip адресов, есть и бесплатные прокси.
НЛО прилетело и опубликовало эту надпись здесь
Нет, не о DDoS-е системе, об обычном боте/парсере/граббере. Так получилось что в своей жизни писал достаточное количество подобных ботов (при этом почти все из них были белыми/серыми, то есть никакого вреда оригинальному сайту и компании не наносили, чаще наоборот, скажем когда магазину-посреднику нужно было сделать интеграцию с оптовым магазином без нормального api), так вот обойти ограничения по ip совсем несложно (если автор бота не совсем школьник). Чаще всего эти ограничения мешают лишь обычным пользователям-людям, которые сидят под одним ip в инете, что бывает довольно часто.
НЛО прилетело и опубликовало эту надпись здесь
Самый просто вариант: от любителей выкачать все расписания и все маршруты на свой сайт. Очень многие считают что сайт-оригинал резиновый и «скачаю я сначала все, а потом буду быстро давать ответы», а когда таких любителей выкачать тысячи ежедневно это мало чем отличается от DDoS-а и легко может положить любой сервер, поэтому приходится с ними хоть как-то, но бороться. Естественно, скачают все равно, распознав капчи или делая запросы в реал тайме и прося распознать капчу пользователя, но такого маштабного DDoS-а уже не будет.
Если есть большое количество желающих выкачать — значит надо не бороться с ними, а сделать платное API.
Естественно, но тут все равно нужна защита сайта, потому все равно большинство школьников/стартаперов захочет скачать все и нахаляву, чем оплачивать пусть дешевое, но платное API, и с таким же успехом завалит любой сервер нахаляву. И только если не сможет, тогда начнет задумывать об оплате либо API, либо… китайцев массово разгадывающих капчи.

P.S. Впрочем, кроме капч есть и другие способы осложнить жизнь ботоводам, такие как сложные генераторы и валидаторы cookies и сессий на сайте и браузере (правда это технически сложнее банальной капчи).
Ух ты, а можно поподробнее?
Диалектическая письменность? Вы путаете с устным Путунхуа. Письменный китайский практически не отличается от провинции к провинции. Разве что в Гонконге есть свои причуды, но там и 12306 не актуален.
Яндекс.Капчу, к сожалению, прикрыли…
Так что вариантов адекватной капчи осталось не так уж и много.
И, на самом деле, гуглокапча — для пользователей уровня наших мам — тоже не самый простой вариант… =\
Капча, для которой достаточно мыши, гораздо удобнее как по собственному ощущению, так и по отзывам пользователей на собственных проектах.
По крайней мере всегда старался избегать вот таких решений: accent-shop.ru/vopros-otvet
Ну да, я бы тоже избегал капчу, которой просто нет:
Это ещё понятно, что картинка целиком не прогрузилась.
А вот у мейл.ру одно время была такая трололо каптча:
image
Там вроде всё просто — mail.ru :-)
А что это за число?
Код — не обязательно число…
Видимо увидели кучу странных переходов с хабра, нашли ошибку и починили :D
reCAPCHA на моей практике легко обходится с помощью сервисов для разгадывания каптч, которые обслуживают миллионы индусов и разгадывают эту капчу вручную. Такое же мнение я слышал от многих моих знакомых по поводу рекаптчи.

Я думаю, те кто имел дело со всякими интернет конкурсами, голосованиями и т.п., сталкивались с такой проблемой.
Так и должно быть.
С помощью миллионов индусов (а равно и китайцев) разгадывается вообще в принципе любая капча, которая может быть разгадана человеком. Сама постановка задачи создания капчи, которая не может быть разгадана этим методом, некорректна.
Если возможно, капчу можно завязать на региональные особенности + учитываем нестандартные каптчи, не варианты «для всех» как рекаптча. Механизмы работы таких каптч не изучены, когда как на популярные каптчи давно созданы специализированные сервисы, с помощью которых они разгадываются, там есть и апи и все автоматизировано, только каптчи разгадывают люди. Поэтому рекаптча как защита от ботов это бесполезная безделушка, даже спамеры их обходят. Рекаптча даже форумы не защищает от ботов и спама по моему опыту.
Видимо по этому у яндекса теперь кириллическая капча, раньше тоже была из латиницы.
Честно говоря далек от темы, но неужели в 2015 году ничего лучше капчи до сих пор нету????
На allfonts.ru, например, используется рекапча с простой галочкой, без картинок. Я так понимаю, определяет роботов по поведению мышки. Ничего не нужно угадывать.
Попробуйте открыть сайт в инкогнито режиме к галочке добавится стандартная рекапча
А вот и нет! Каждый день захожу на хабр из инкогнито хрома и ставлю только галку. Только изредка всплывает сама капча, но такого давно не было.
При этом больше нигде не залогинены? IP адрес не статический?
Ну, если честно, обычно перед этим логинюсь в ВК и гмэйл, но опять же иногда наоборот на сначала на хабре. Попробую логиниться сначала на хабре в течение следующей неделе. Так делаю на работе — как организована сеть — не знаю.
если сначала логинитесь в гмэйл — то вот это и ответ на ваш вопрос! ;)
ведь это первое условие автогалки новой рекапчи, гугл так точно подтверждает что вы не бот)
если нет — то полагаю что статический апишник тоже может играть свою роль (у юриков обычно ip-адреса статические по умолчанию).
Провел пару экспериментов. Мне кажется рекапча может хранить в базе стиль набирания текста. Если набирать почту вручную — капча не всплывает. Это конечно не отменяет сказанного выше.
Только галочка используется лишь в том случае, если вас уже идентифицировали ))
эвона как… Спасибо.
НЛО прилетело и опубликовало эту надпись здесь
Сурово )) Фраза понравилась, поискал источник. Нашлась вот тут в реплике Mithgol
НЛО прилетело и опубликовало эту надпись здесь
Я может чего-то не понимаю, но какой смысл в капче, которую с вероятностью 12.5% можно просто угадать?
думаю вы немного ошиблись в расчетах, выбрать нужно от одной (или может от ни одной :)) до восьми карточек. Что-то вроде 1/256.
А, действительно не понял. Решил, что выбирается только одна.
2^6 степени вариантов, а не 8. откуда вы взяли 12,5%? ;)
ну тогда уж 2^6-1 вариантов. Ничего не выбирать нельзя ведь? или можно?
Все зависит от фантазии этих китайцев, ктожихразберет)
(и 2^8 конечно же, что-то меня переклинило что вариантов там 6, а не 8))
Или молча терпеть такую капчу, или обнаруживать, что через 5 секунд после поступления билетов в продажу их уже не осталось, потому что они все скуплены для барыг автоматом, использующим антигейт сервис, которые решает простые капчи.

Оплата на Таобао иногда (в зависимости от фазы Луны) намного дебильнее бывает: капча на размещении заказа, капча на оплате, плюс смс на твой номер с кодом подтверждения… все, чтобы паршивые 10 юаней за какие-нибудь носки у меня милостиво приняли.
Я один тут кто угадал все правильные варианты на капчах? Проблема капчи как-то раздута. Вот падение серверов — это серьезно.
Может, мы просто китайцы, только еще не осознали этого? :)
Рекапча с галочкой — нехорошая вещь. После нажатия нужно несколько секунд ждать, иначе посчитают роботом.
Вы от имени роботов пишете? :)
Извиняюсь за вопрос, вы в дверь в туалет этой капчей открываете, что, ну, допустим, 100 раз в день (как мне каждется, сильно завышенная цифра), вам долго ждать 5 секунд (хотя вроде меньше)? По мне, так задержка при ответе — самый адекватный вариант препятствования DDoS-у.
Я и так сделал задержку, сочиняя комментарий / заполняя форму. Если бы капчу ставили в самое начало формы, задержка бы не была заметна, а две секунды вынужденного ничегонеделанья перед нажатием «отправить» слишком заметны. Более того, задержка искуственная, покупкой нового железа её не исправишь.
А что вам в капче с вонтонами не нравится? Что это такое, знают даже все дети от двух лет, наверно. Примерно, как в России про пельмени спросить. :)
Я про дерьмовые картинки, которые за шумами не разглядеть ;-)
Меня вообще веселят эти капчи. У меня адская близорукость и с распознаванием разных цветов есть всякие неприятные ньансы.
В 90% для распознавания этих поделий приходится призывать на помощь коллег. Так вот народ со стопроцентным зрением, хорошим цветораспознаванием и правами на вождение тоже распознает все это далеко не с первого раза
Это не капча, а ерунда. Угадываемость 1 из 8 — не остановит никого. (upd: только потом прочитал, что надо выбирать несколько картинок)
Что вы тут сопли разпустили ?! У нас дохренище сайтов с такой капчой. Тот же тостер.
А кто-нибудь хулиганит при решении реКапчи, вводя вместо не-проверочного слова непечатное ругательство? :)
Борись против системы, мочи манту!
А откуда вам известна статистика сколько пользователей вводят капчу с первого раза?
Регулярно пользуюсь этим сайтом. Буквально на днях попалось:

Надо указать размер «С»
Картинка



Мне одному интересно, почему домен именно 12306?
Может это индекс головняка?
Это короткий номер телефона службы поддержки жд. В Китае многие сервисы имеют 5ти значный номер службы поддержки и сайт с таким же адресом. (10010, 10086)

Почему именно этот номер я не знаю. Вероятно это регулируется государством (выдача номера, требование к названию сайта и т.д.)
Вот тут статьи об этом: хабр или вот более полная на vc.ru.
Как-то, гуляя по 1688.com (китайская Алибаба), просто ради шутки решил проверить, существует ли сайт <четверка вместо шестерки>.com (не буду писать адрес, вдруг даже это число уже внесли в «экстремистский список») — и ведь существует, тоже китайский, при этом это совершенно обычный и с виду не слишком популярный сайт юридической помощи (экстремистского и прочего запрещенного содержания не обнаружено)
Где-то я видел капчу, где надо было повернуть картинку так, чтобы она была в правильном (вертикальном) положении. Вот здесь робот обломится.
Целых четыре варианта. Звучит надежно.
Мне вот такая нравится. Однако, иногда у людей возникают сложности, где задание нельзя понять посмотрев на картинку (а надо еще и прочесть). http://demo.areyouahuman.com/mrpotatohead/ Еще встречал неплохой вариант — паззлы)
«нормальная кириллическая капча от Яндекса»
Это не пример нормальной капчи. Это тот же китайский.
Сидел в клубе заграницей и не мог зайти на почту!
www.yandex.com чем вам не угодил?
Единственное, что я не понимаю (это не относится к самой капче) — каким образом работают спекулянты, когда билет без удостоверения личности не купить? Решение элементарное ведь — номер удостоверения (ШФЖ для китайца, паспорт для иностранца) напечатать на билете или загнать в QR-код, а затем проверять при посадке. У нас ведь именно так, по билету не на своё имя в поезд не посадят (ну, разве что, с проводником «договориться»). Помню, как-то поездка на поезде неудачно совпала с заменой паспорта по достижению 20-летия, так на станции мне заявили, что «фиг вам, не пустит вас никто по временному удостоверению личности (хотя ФИО там то же самое, да и сам документ имеет силу удостоверения личности в таких случаях), сдавайте билет и покупайте по-новой» (кончилось все тем, что нашел авиабилеты по той же цене и без долгих раздумий сдал ж/д билеты, благо до поездки было еще несколько дней).
Да у них и так печатают и имя, и номер паспорта/шфж (частично), и при входе на вокзал проверяют и билет, и паспорт.
image
Возможно, они таким образом борятся с созданием альтернативных приложений для покупки билетов.
Просто как-то на днях попалась статейка в Вэйсине как раз про это, и там утверждалось, что это всё защита от ужасных и злобных 黄牛 (барыга, спекулянт), которые якобы пачками скупают билеты на чужие шэньфэньчжэны (после чего простые юзеры, чьи ШФЖ попали под раздачу, якобы не могут зарегаться), а затем якобы загоняют их втридорога (если я всё правильно прочел) — сразу после этого и возник вопрос — так как сам помню, что покупал билет по паспорту, как-то глупо на этом фоне утверждения про спекулянтов смотрятся
Подозреваю, что во время ажиотажа под новый год и может такое прокатить, когда в столпотворении на вокзале контролёры максимум могут проверить сам билет, но не его совпадение с швж (кто был в китайский нг на китайском вокзале — поймёт). Но не буду утверждать.
На самом деле, и на российских поездах проверяют паспорт только при входе, достаточно под видом провожающего попасть в вагон, а там уже проверяют только билеты в 99,9% случаев. ИМХО.
В Китае, кстати, провожающих и встречающих к поезду близко не подпускают. Впринципе. Только с билетами.
Я нечасто езжу в поездах, но пару раз было, что на какой-нибудь станции заходят контролёры с ментами и проверяют у всех подряд паспорта и билеты. На автобусах «Ростов-Москва» вообще всегда проверяли, когда ездил.
Ростов? Ну да, южное направление. Там бывает. Тоже встречал. Как за Воронеж выехал, так всё. Там ведь и Сочи, и Чечня с Дагестаном, да и весь заграничный Кавказ впереди.
Рекапча лучше стала, но еще совсем недавно я мог ее по 10 раз вводить и даже плевать и закрывать вкладку с пульсирующей венкой на лбу.

Да, у меня есть венка, я не робот.
Я так и не понял, суть претензии в самом принципе предоставить выбор из 8 картинок, или в безидейно подобранных картинках и вопросах?
Если в безидейно подобранных вопросах, то я согласен, а если претензии к самому принципу, то не соглашусь.

Например, на сайте киевстара для отправки смс надо выбрать из набора 2 или 3 картинки с живой природой(когда-то так было, как сейчас — не знаю). Помоему, нормальный вариант капчи. По крайней мере, лучше, чем ввести буквы, на которых не сидит кот.
Идея хорошая, реализация плохая. Картинки некачественные и непонятные. (или я робот).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории