m1rko 27 янв 2017 в 00:17

На 100% правильный способ проверки адресов электронной почты

5 мин

141K

Программирование*Регулярные выражения*

Перевод

+60

Комментарии 98

NeonLost 27 янв 2017 в 01:13

Как раз недавно выпиливал проверку email в одном из приложений, полностью согласен с автором. Все проверки бессмысленны, единственное, что стоит проверить это наличие собаки в строке.

+12

Vahan 27 янв 2017 в 11:06

Не все так просто (-:

brizzz 28 янв 2017 в 12:45

А за что заминусили? Годный коммент. В пользу того что всё-таки валидировать email адреса на соответствие стандартам не помешает.

Vahan 28 янв 2017 в 15:38

Наверное минус за то, что swiftmail уже запатчили.

НЛО прилетело и опубликовало эту надпись здесь

TimsTims 27 янв 2017 в 18:44

Да, дождались!

Ждем еще пару лет, чтобы из статьи убрать кучу воды, и два предложения:
1) Правильная валидация email: @
2) Проверка существования email: отправить письмо

Akuma 27 янв 2017 в 01:53

Еще небольшое улучшение. Добавить активцию в приветственное письмо. Что-то вроде:

Добро пожаловать на наш мега-крутой сайт,
мы сильно вам рады, поэтому вот вам классная кнопка чтобы быстрее перейти на сайт/сделать покупку:

КНОПКА (Ведет на сайт и сразу активирует Емаил)

— Это иногда работает лучше, чем кнопка «Активировать/Подтвердить», но зависит от аудитории.

flamefork 29 янв 2017 в 17:21

Прям антисовет. Почти никто не читает приветственные письма.

Akuma 29 янв 2017 в 17:32

Зависит от аудитории.
Если бы их ни кто не читал, эти письма и не рассылал бы никто.

Jogger 27 янв 2017 в 02:56

Только вот как всегда, замечательны слова любой статьи разбиваются о реальность — никто их не читает, а если читает — то не следует им.

za90 27 янв 2017 в 08:49

Пятница! Выдыхай ))

demin 27 янв 2017 в 03:48

<input type="email">

и пусть разработчики браузеров об этом беспокоятся, а не я

+14

Ohar 27 янв 2017 в 04:03

Это решит только п.1.

za90 27 янв 2017 в 07:19

Только его и нужно решать.

+10

johny 27 янв 2017 в 06:30

Как же бесят валидаторы, которые считают, что кроме символов [a-z\-\.@] больше ничего в адресе электронной почты не существует. Они даже плюс заворачивают как недействительный символ.

Syrex 27 янв 2017 в 10:34

Приведенный Вами валидатор еще и цифры посчитает недействительными :)

svilgelm 27 янв 2017 в 11:06

Больше всего бесят валидаторы, которые не пропускают email адреса из не .com/.org доменов

НЛО прилетело и опубликовало эту надпись здесь

za90 27 янв 2017 в 07:21

Статья так быстро и толково закончилась (с 4" читал). Большая редкость, эта ваша сестра!)

PS: кто такие «дерилы»?

cheshirrrr 27 янв 2017 в 08:51

Может это отсылка к американским реднекам?
Первой строкой в гугле на имя «Daryl» вылезает Daryl Dixon из «Ходячих мертвецов», как раз представитель стереотипных реднеков.

lockywolf 27 янв 2017 в 07:40

На моей памяти, это уже четвёртая или пятая статья про валидацию имейла.

za90 27 янв 2017 в 08:49

В пятничном формате первая. Всем добра в этом треде.

evil_kabab 27 янв 2017 в 08:05

Если адрес электропочты критичен, тогда есть смысл спросить его ДВА раза и отключить копи-пейст на обоих полях. Заставить юзера два раза напечатать его эл. адрес.

-16

UksusoFF 27 янв 2017 в 09:02

Вы уверены что два раза напечатать будет менее ошибочно чем скопипастить из тхт из которого пользователь всю жизнь копипастит?

evil_kabab 29 янв 2017 в 14:14

Оба раза должны совпасть конечно же.

UksusoFF 29 янв 2017 в 16:56

И что? На не привычной клавиатуре например вполне можно набрать два раза не правильно. Кнопка какая-то может западать. Да мало ли вариантов.

cheshirrrr 27 янв 2017 в 09:11

Только сперва задумайтесь настолько ли нужен пользователю именно ваш сайт, что он будет дважды ручками вводить свой e-mail.

+11

wladyspb 27 янв 2017 в 18:08

Когда можно копипастить — копипащу из первого во второе. Когда нельзя — я действительно задумаюсь, а надо ли мне тут региться. Лишние поля — зло в любом случае.

IT_Hound 28 янв 2017 в 17:14

В случае с большинством интернет магазинов ответ очевиден.

evil_kabab 29 янв 2017 в 14:16

Я про серьезные сайты сейчас… На чем-то менее серьезном хватит и 1 раз имейл. Или фейсбук

merlin-vrn 27 янв 2017 в 10:21

я в упор не понимаю, зачем пароль скрывают и два раза просят ввести, ведь все пишут его в keepass/etc., а потом копипастят в оба поля, а вы ещё и с адресом предлагаете извращаться

когда вижу такое извращение, единственная мысль — ну что за дебилы собрались

-4

НЛО прилетело и опубликовало эту надпись здесь

Iora 27 янв 2017 в 11:42

ведь все пишут его в keepass/etc., а потом копипастят в оба поля

Все?! То есть по-вашему, пароли никто не помнит, м? Бедные люди.

lobzanoff 27 янв 2017 в 14:13

У меня, к примеру, несколько десятков паролей, и все вида «o9uG@:JZbqcYCh*o=;DPsf~L»
Вы всерьез полагаете, что у всех такая же эйдетическая память как у Шелдона Купера?!

Charg 27 янв 2017 в 14:51

> У меня, к примеру, несколько десятков паролей, и все вида «o9uG@:JZbqcYCh*o=;DPsf~L»

Ну ладно, а следует ли из этого утверждения что подобные пароли — у всех?

aosja 27 янв 2017 в 16:58

Все-не все — это не важно. Важно то, что разработчик не заботится об удобстве пользователя и запрещает копи-паст. А если я потерял пароль или забыл? Как меня спасет то, что я смог без ошибок х-раз его ввести вручную при регистрации? Всегда должна быть возможность восстановить пароль, а не парить с ручным вводом.

Squoworode 27 янв 2017 в 11:07

Копирующие из блокнотика обидятся и уйдут.

maxdedepol 27 янв 2017 в 12:14

Я в 90% случаев увидев 2 email просто ухожу, в 10% сайт как бы нужен, но я всегда копирую первое поле и если мне ещё и это не дадут сделать, то скорее всего я пойду искать конкурента у которого нет таких заморочек.

navion 27 янв 2017 в 18:12

Как же я тебя ненавижу!

goodwin98 27 янв 2017 в 18:17

А почему нет варианта отправлять самим пользователем письмо с каким-то уникальным ключом?
Тогда ошибки не будет 100%

Jogger 27 янв 2017 в 18:24

Я смотрю у вас ник не для красного словца выбран…

ElForastero 27 янв 2017 в 08:05

http://www.ex-parrot.com/~pdw/Mail-RFC822-Address.html

Don't mention it…

-2

Jogger 27 янв 2017 в 18:34

Статью не читай @ сразу отвечай.

kefirfromperm 27 янв 2017 в 08:49

Очередная статья о том, что вместо того чтобы решать проблему, её можно проигнорировать. А давайте сформулируем задачу так: найти в произвольном тексте все email-адреса. По одной лишь собаке будете искать?

-7

Ogra 27 янв 2017 в 09:54

Это совсем другая задача, и решать её следует по другому.

OtshelnikFm 27 янв 2017 в 10:24

Проверять что введен символ собаки и что минимум есть еще 2 символа a@a

Вопрос такой есть — если регистрируешься через мобильное приложение, а там надо подтвердить регистрацию. Потом надо сворачивать приложение, идти в браузер на почту, через почту кликаю на ссылке подтверждения и… куда я попадаю? В это мобильное приложение или откроется ссылка в браузере?

Потом опять возвращаться в мобильное приложение?

Тут от этой логики у меня сорвало клапаны… Проясните.

Virasio 27 янв 2017 в 10:44

Ну хорошо сделанные сайты после активации автоматом в приложение перекидывают. А в почту пользователь обычно попадает из прилетевшего пуш-уведомления о новом письме.

alexeykuzmin0 27 янв 2017 в 11:04

По крайней мере у меня на андроиде этот процесс выглядит куда проще.
1. Зашел на сайт/в приложение, вбил все данные, зарегистрировался.
2. Приходит push-уведомление от GMail о приходе письма, тыркаю на него.
3. Открывается письмо, в нем кнопка или ссылка, тыркаю на нее.
4. Открывается браузер, в нем новая вкладка говорит «хозяин, готово». Тыркаю на кнопку «назад».
5. Грузится опять приложение GMail с тем самым письмом, тыркаю еще раз назад.
6. Открывается та самая вкладка в браузере или приложение. Иногда надо еще тыркнуть на «обновить».

Итого 5 или 6 тапов, весь процесс занимает не более 10 секунд и какого-то отторжения не вызывает.

Urichalex 27 янв 2017 в 11:07

мобильным приложением можно перехватывать определенные ссылки.
Определяем, что пользователь отправил на активацию с мобильного, формируем ссылку для мобильного, клиент ее тычет, андроид спрашивает, как ее открыть, браузером или приложением

Virasio 27 янв 2017 в 10:41

Кажется я уже читал нечто подобное… У меня в гугле первая статья по запросу «валидация email»: https://habrahabr.ru/post/175375/ Я года два назад оригинал той статьи заказчику скидывал, когда он приставал ко мне с валидацией.

Wesha 28 янв 2017 в 02:00

Я знал, как валидировать email-адрес. Пока не прочитал RFC.

miksoft 27 янв 2017 в 10:49

Пользователь с гораздо большей вероятностью введёт неправильный и действительный адрес, чем недействительный.

Вероятно, это зависит от аудитории. По моей практике — точно наоборот. Неправильный и действительный адрес был едва ли один за несколько лет. А вот недействительные каждый день вводят.

Вот что стоит, имхо, проверять, так это опечатки самых распространенных доменов. У нас это самая популярная ошибка, примерно четверть от всех недействительных адресов.

Kliba 27 янв 2017 в 12:44

Опечатка в домене в 99% сделает адрес неправильным, недоступным, но не недействительным. Недействительным его сделает только несоответствие стандарту.

НЛО прилетело и опубликовало эту надпись здесь

jetexe 27 янв 2017 в 11:23

и очень сильно увеличит отклик формы и не совсем понятно зачем. Рядовой случай такой:

регистрация пускает в профиль (юзер с минимальными правами но уже у нас в безе)
отправка письма подтверждения
Активация аккаунта.

Зачем тут проверять MX? и что это конкретно даст? гарантию того что на домене есть почтовый сервер?
Ну допустим у нас человек опечатался и ввел mael.ru и что дальше? MX у этого домена есть.
Или забыл что нужно вводить gmail.com, а не google.com, и не google.ru, и даже не gmail.ru (такой MX тоже есть)

И адрес валидный, и MX есть, вот только почта указана неверно

alexeykuzmin0 27 янв 2017 в 11:27

Я вам больше скажу: есть немало народу с почтой на google.com

jetexe 27 янв 2017 в 11:31

На всех приведенных мной примерах есть настоящие электронные почты настоящих людей.
В случае с google.* это сотрудники компании

Virasio 27 янв 2017 в 11:42

А что если после @ указан IPv6-адрес?

grossws 28 янв 2017 в 22:29

И сломает кучу товарищей, которые до сих пор не добавили MX, но используют A. И такое MTA вполне допускают.

nikitasius 30 янв 2017 в 10:08

Далеко ходить не надо, сейчас без dmarc, dkim, spf, MX и r-dns (которая соотв. ответу мейлсервера) письма будут улетать в спам. Причем у гугла это еще более менее человечно, а у мелкософта — не глядя.

grossws 30 янв 2017 в 19:25

DMARC, благо, пока не является обязательным условием для жизни, как и DKIM. А настроить MX, rev DNS и SPF — дело недолгое.

Гугл больше бесит отправкой легитимных писем из рассылок в spam, а иногда их отбрасыванием, чего очень не любят ezmlm и mailman. Меня из некоторых списков рассылки так выкидывало. И крайне неприятно, когда это какой-нибудь members@apache.org, а не просто какой-нибудь high traffic dev@.

nikitasius 31 янв 2017 в 00:02

А что трудного в том, чтобы настроить dmarc и dkim?

grossws 31 янв 2017 в 11:19

Для разумного админа, наверное, ничего сложного. Просто настроить какой-нибудь opendkim — дело нехитрое. Несколько больший геморрой (административный, в первую очередь) — управления ключами на всех серверах, которые отправляют почту наружу, управление доверенными хостами и подобные вещи.

nikitasius 31 янв 2017 в 16:25

Там в ключах прописан домен. Ничего не мешает скопировать такой ключ на «второй» сервер, который отправляет почту по тому же домену. Да и перегенерировать их не нужно.

В идеале будет вот так:

картинка

Только мне нам spamrats подпортили, так как это скрин с почты виртуалки и они тупо всю подсеть загнали. С другой стороны на них как бы и насрать, так как они никто, и я пока еще не видел, чтобы письма отсюда блочились. А лишний раз с ними переписываться — время тратить.

fpinger 27 янв 2017 в 11:05

А ведь можно на основе «правильной» проверки отсеять кучу спамеров и особо одарённых. И это прекрасно для большинства сервисов. :P

reforms 27 янв 2017 в 11:06

Хороший перевод, спасибо. С автором статьи согласен.
Но мне показалось, что к первым двум пунктам:
1. Понимает ли пользователь, что от него требуется ввести адрес электронной почты в это поле?
2. Правильно ли он ввёл свой адрес в поле?
Обязательно нужно добавить 3 — А насколько Вашему сервису важно знать валидный адрес пользователя?
И мыслей здесь несколько:
1. Со времен появления сотовых телефонов значимость почты в разрезе возможности идентификации пользователя и обратной связи с ним резко упала.
2. Что важней, что пользователь получит возможность приносить Вам прибыль, пользуясь Вашим сервисом (например ввиде покупки товаров и т.п.) или обязательная доставка рекламы на его почтовый адрес?

Но справедливость ради скажу, что участвовал в проекте где были четкие бизнес требования на проверку введенного пользователем адреса (не массовый продукт) и связано это было с внутренним регламентом компании-закаpчика (ограничение по допустимым доменам и именам до собаки)
Так что всякое бывает.

Rende11 27 янв 2017 в 11:22

Напомнило видео Андрея Листочкина, один из примеров был как раз про валидацию.

ruslanfedoseenko 27 янв 2017 в 11:42

Реальность email-а можно проверить подключившись к SMTP серверу и якобы пытаться отправить письмо. Адрес сервера можно вытащить из MX записей жлмена. После указания адреса кому отправляем большинство почтовых серверов отвечают ошибкой в случае отсутствия аккаунта, что свидетельствует об ошибке ввода или попытке ввести фейковый адрес.

miksoft 27 янв 2017 в 11:56

Реальность email-а можно проверить подключившись к SMTP серверу и якобы пытаться отправить письмо.

Далеко не всегда.
Например, у нас на работе тот сервер, который отвечает по MX-записи, не является конечным сервером и не содержит список всех адресов домена, а лишь принимает и передает все без разбору письма следующему серверу, который уже и занимается сортировкой писем по ящикам.

Такая схема была распространена во времена диалапа, когда связь с интернетом была эпизодической. Собственно, с тех времен она у нас и сохранилась.

jetexe 27 янв 2017 в 12:03

окей, адрес существует, просто чужой не rfedoseenko@mail а efedoseenko@mail, соседние буковки, банальная опечатка

xRay 27 янв 2017 в 11:46

Т.е. валидация не нужна и пихаем в базу все что пользователь там ввел? Серьзно?

-2

xxxFeLiXxxx 27 янв 2017 в 12:18

Именно так, а если валидация через ссылку в мейле не прошла на протяжении TTL — то удаляем из базы.

vintage 28 янв 2017 в 13:40

Я вам больше скажу, ввод пользователя всегда нужно сохранять в сыром виде.

nikitasius 27 янв 2017 в 12:17

Согласитесь это классно:

-какой у тебя мейл?
-#!$%&’*+-/=?^_`{}|~@example.com
-??
-слеш затем...

Какой смысл в таких ящиках, если нормальный человек (не sup3r}{ack3%-@example.com) будет использовать [-_.0-9a-z] слева от @?

kimisa 27 янв 2017 в 12:34

Я тоже так считаю, что рядовой пользователь будет вводить символы a-z0-9, ну и край — и +. Все остальные извращенцы составят примерно 1% от основного состава. Задумайтесь, а нужны ли они вам?
P.S. Это каким нужно быть извращенцем, чтобы каждый раз вводить свою почту в виде #!$%&’*+-/=?^_`{}|~@example.com?

nikitasius 27 янв 2017 в 13:37

Я вам скажу больше, у меня почта вида a@abc.ab (там 3 буквенный домен в 2 буквенной зоне), с которой стоит форванд на основной [a-z] ящик.
Делал специально, чтобы люди (в том числе иностранцы) не имели проблем записать мой мейл из телефонного разговора… с другой стороны они меня каждый раз спрашивают (кто слышет в первый раз), не ошибся ли я в почте, мол она неправильная на их взгляд, так как люди привыкли к хотмейлам и гмейлам.

kimisa 27 янв 2017 в 13:45

Я об этом и веду речь. Почти все привыкли слышать и читать ящики в буквенно-цифровом виде и плюс еще тире. Если выходишь за рамки общепринятых обозначений, то начинают переспрашивать и уточнять. Поэтому есть ли смысл пропускать такие исключения? Если это не сайт гиков программистов или сисадминов. ;) Вот реально можно ожидать всё, что угодно. Но вот какова вероятность встретить такие адреса?

Jogger 27 янв 2017 в 16:21

А какой смысл отсеивать таких пользователей? Не могу придумать никакой причины для этого кроме «хочу чтобы меня кто-нибудь ненавидел».

kimisa 27 янв 2017 в 16:25

Зато достаточно по валидации определиться /^[a-zа-яё0-9_\-\.]{2,30}@[a-zа-яё0-9_\-\.]{1,40}$/iu
Может и не идеально, но почти все нормальные ящики сюда можно загнать.

Jogger 27 янв 2017 в 17:35

Ещё раз спрашиваю — ЗАЧЕМ? Вы делаете дополнительную проверку, исполняете дополнительный код, который кто-то дополнительно разработал — а из «полезных» результатов — только увеличение энтропии во вселенной и ненависть нескольких человек по отношению к вам. Вам шашечки или ехать?

nikitasius 28 янв 2017 в 00:20

Как минимум ящики надо проверять, а не ловить ошибки от мейлера.

А далее — уже личное дело каждого. Кто девушку ужинает, тот ее и танцует, только в плане сервера. Каждый админ это художник, он делает так видит… в лучшую или худшую стороны.

Да и RFC… если оставить [\w\.\-_] юзеров, то никто и не пострадает… в большей массе.
И RFC RFC рознь.

Скрытый текст

Я вот сейчас занят конфигуратором для NSD, меня от RFC по DNS просто тошнит, в итоге я просто взял исходник NSD и по ним делаю базу и конфигуратор. Если уж NSD не 100% соотв. RFC (например по длине полей), то и мой продукт будет так же не полностью соответствовать.

Jogger 28 янв 2017 в 00:54

Вы так и не ответили на главный вопрос — зачем? Зачем проверять ящики? Ну усложните вы кому-то с необычным ящиком жизнь, вам-то что от этого? Столько усилий только для того, чтобы кому-то нагадить? Ведь то, что ящик соответствует вашему шаблону — не гарантирует того, что мейлер не вывалит ошибку (потому что домена например не существует), и не грантирует того, что емейл введён верно (если например опечатались в имени). Это не даст ничего ни вам, ни вашему приложению. Ну, разве что если вы работник на ставке и вам нужно изобразить бурную деятельность, а то что результат бесполезен — не ваша проблема?

nikitasius 29 янв 2017 в 01:01

Так можно и данные на SQL проверять, и сразу в базу!

На самом деле все просто — почта такая, как я писал выше, она серая и убогая. Талантливые и яркие }{aцkéрbI@ идут лесом искать другие сервисы (=делать другую почту), так как скрипты, которые вероятно что-то делают или как-то обрабатывают ящики (я ничего с мыльниками не делаю) могут сломаться, и значит из надо переписать, что ломает. Следом уязвимости (как в пхпмейлеров), хрен знает что еще найдут, но она не взлетит, если система просто проигнорит такую почту.

Дискуссию не о чем. Я, например, не люблю, когда в базе каша в адресах, значит у меня и все подконтрольные сервера не примут такие ящики. Дале хуже… у меня вообще пачка проверок на клиентов (которые ко мне лезут на коннект), в том числе и на reverse dns, и если что-то не нравится — reject.

-2

Jogger 29 янв 2017 в 01:11

Спасибо, теперь мне всё ясно. Синдром вахтёра в терминальной стадии. Вопросов больше не имею.

nikitasius 30 янв 2017 в 01:26

Скорее педанта-библиотекаря и воспитателя детсада.

-1

grossws 28 янв 2017 в 22:39

Да и RFC… если оставить [\w.-_] юзеров, то никто и не пострадает…

Только ВасяПупкин+майор@мвд.рф xD

grossws 28 янв 2017 в 22:37

И адрес nikitasius из примера выше не пройдёт, т. к. перед @ всего 1 символ.

kimisa 29 янв 2017 в 07:29

Если ящик один в один такого типа, то я еще таких не встречала. Поэтому пусть идет и регенет нормальный ящик.

-4

nikitasius 30 янв 2017 в 10:06

Лол, разница между

оставить числа, буквы и -._
тоже самое + 2+ символа слева от @

Видна невооруженным глазом.

grossws 28 янв 2017 в 22:34

А ещё -, _ и . часто используются. Видел кучу рабочих адресов вида name.lastname@..., lastname.f@... и т. п.

НЛО прилетело и опубликовало эту надпись здесь

alexeykuzmin0 27 янв 2017 в 20:40

Учитывая, что example.com купить нельзя, сомневаюсь

nikitasius 28 янв 2017 в 00:05

У нее был (.)(.)~@example.com

dpantele 28 янв 2017 в 19:35

А почему никто не валидирует e-mail через oauth-like механизм? И почему ещё gmail не предоставляет возможности web-подтверждения подписок на рассылки/указания e-mail при регистрации? Это же на 100% решает проблему распознавания спама для активационных e-mail.