Pull to refresh

Comments 21

Всего имеется 1 280 448 валидных четырехсимвольных логинов. Из них на момент проверки было свободно 213 895, то есть 16.7%.

И сколько Яндекс терпел? Или с таймаутами ддосили?

UFO landed and left these words here
UFO landed and left these words here

Например, вот так:
telnet mx.yandex.ru 25
...
...
rcpt to: xtkt@yandex.ru
550 5.7.1 No such user!

У меня есть почта у которой логин отличается (сильно). Такое случилось при миграции почты с narod.ru в яндекс. Логин остался от народа, а почту яндекс предложил создать новую.

Генерация логинов и определение доступности

Краткое описание алгоритма:

    • сначала генерируются первый и последний символы согласно ограничениям

    • для средней части логина генерируются допустимые конфигурации расположения точек

    • для каждой из конфигураций точек в свободных местах проставляются числа и буквы

    Реализация на Python

    Насчёт капч в консоль не уверен, а вот просто игнорить (403) запросы запросто.
    Кстати, может не заблочили потому, что как раз DDos`ы.
    Во время DDos-акаки с одного ip адреса может прилететь много запросов, так что не сильно назойливых (что такое лям запросов для Яндекса?) и не банят.
    Может, просто повезло

Вот люблю я такие разборы: мало того что проценты, так ещё и с визуализацией.

Но, думаю, возможно стоит учитывать из доступных вариантов возможные исключения.

GAME OVER - WOT

Уверен, что все логины, которые встречаются в словарях, уже заняты. То есть свободными остались только бессмысленные сочетания букв и цифр. Это легко проверить, так как данные есть на GitHub, но у меня под рукой нет набора, с которым можно сравнить.

По поводу визуализаций и представления результатов в целом: на это потратил больше всего времени. Хотелось, чтобы картинка говорила сама за себя, но добиться этого не удалось. К диаграммам из статьи пришлось сделать пояснения о том, как их правильно читать. Для пунктов про числа из логинов и группы свободных / занятых логинов вообще не удалось подобрать что-то наглядное.

Хах, уже поразбирали самые интересные!

Но я, к своему удивлению, счастливый обладатель четырёхзнака. :)

Тоже есть четырехзнак и тоже не сразу это понял :)

Вопрос про адреса ящиков на яндексе. В свое время была почта на народе <name>@narod.ru. Когда они объединились с яндексом, мне автоматически добавилась почта <name>@yandex.ru (вроде еще какие-то алиасы такого же типа). То есть оба адреса мои, письма могут приходить на оба. Но очень часто приходят реальные письма (не спам) на <name>@yandex.ru: то дети домашнее задание пришлют, то какие-то фактуры, раз даже скан паспорта приходил. Можно предположить, что люди ошибаются в адресе, но очень уж часто это происходит, и такое только с этим ящиком. Предполагаю, что во времена объединения что-то накосячили. Пытался писать в техподдержку яндекса: у них все хорошо. Пытался писать тем, кто присылает письма - обратной связи не получил. Может кто-то с подобным сталкивался? Есть какие-то объяснения? Или все-таки ошибаются в адресе?

Здравствуйте! Я из Яндекса. Уточните, пожалуйста, номер обращения — всё проверю.

Это очень давняя тема. Нашел в архивах: Ticket#17120113011151497.

В ответе было:

"Адрес <name>@narod.ru привязан только к Вашему аккаунту.
Скорее всего, кто-то указал в качестве контактного Ваш e-mail. Это не значит, что он может пользоваться Вашим почтовым ящиком.
Мы, увы, не можем запретить кому-либо отправлять письма на Ваш адрес. Если Вы не хотите получать их — свяжитесь, пожалуйста, с администрацией сайта, откуда поступают письма, и объясните им, что это не Вы регистрировались на их ресурсе, и Ваш адрес указан в качестве контактного по ошибке.
Также можно внести адрес отправителя этих писем в Чёрный список, тогда Вы больше не будете получать их."

Я не стал тогда добивать эту тему, прочитав такой ответ. Для меня логично, что проблема не в адресе, про который мне написали в ответе. Я предполагаю, что проблема в других алиасах (что-нибудь вроде <name>@yandex.by и т.п.), но техподдержка видимо этого не проверяла. Сейчас, читая статью, вспомнил про проблему и спросил: не сталкивался ли кто с таким же. Кстати, левые письма ко мне приходят до их пор.

От себя скажу, что на мои короткие адреса иногда приходят письма с разных сервисов. Например, приходили купленные билеты на какой-то матч UFC в Москве или письма из Икеи для какой-то женщины. Как я понял, люди в некоторых случаях просто вбивают левый адрес и это оказывается мой адрес. И не все сервисы проверяют принадлежность почты через отправку кода.

Спасибо за уточнение! Я проверил информацию, уже возвращаюсь к вам. С вашим почтовым ящиком всё в порядке, вероятно, кто-то действительно ошибочно указал его в качестве контактного адреса. Уточню, что один адрес, включая его алиасы, может принадлежать только одному пользователю.

О, актуальная проблемка! У меня аналогичная вставала с Гмэйлом (да и не только с ним, что видно хотя бы по моему логину на Хабре).

Сделал по этому поводу генератор логинов, который бы выдавал нечто более-менее человеческое. Логины генерились случайно, но таким образом, что триграммы по вероятности использования соответствовали реальному английскому тексту.

Потом приделал к этому проверялку логинов на занятость. В итоге получился сайтик для выбора свободных логинов на Гмэйле -- http://freelogin.ru

Дальше собрался радостно писать статью на Хабр, но тут как-то лень стало... И уже пару лет всё в таком виде болтается, не знаю, что с ним делать (а тут ещё проверялка отвалилась, тоже с июля никак не починю, короче, мотивация закончилась).

Да, в случае с gmail перебор не подойдет (минимальная длина - 6 символов), поэтому ваш подход выглядит хорошим решением проблемы удобного логина. Сайт удобный. Понятно, что проблема не супер острая и результат может быть не очень важным, но я считаю, что статья с описанием пути от идеи до реализации будет полезной. Банально интересно какой процент занятых логинов выдает ваш генератор (как я понял, они отсекаются и не попадают на сайт).

Занятые, естественно, отсекаются. Но напрямую из базы нормальную статистику получить не удастся, поскольку там не бесконечная генерация, а скрипты ориентируются на поддержание определённого количества незанятых логинов. Если при перепроверке старых логинов оказывается, что какие-то из старых стали занятыми, и незанятых стало меньше нужного количества, то генерируется ещё порция новых.

Sign up to leave a comment.

Articles