Когда пользователи не знают что их контакты порежутся, они их не особо то и маскируют. И вот тогда защита от дурака срабатывает всегда!
Повторюсь: для конкретного сайта (30.000 постов) эти регулярки покрыли если не 100%, то 99% всех телефонов и email'ов.
На счет эффективности при введении фильтрации спорить не буду, но после первичного отсева пользователи уже будут в курсе, что адреса режутся и будут искать способы обойти ограничение.
Вам уже пришлось встраивать фильтр на добавление информации или это только предстоит? (Возможно, последующая фильтрация в задачи не входит, тогда мой вопрос не имеет смысла)
Пользователь загружает резюме (doc/docx/txt), там есть контакты, мы их режим.
Как правило, у одного пользователя одно резюме.
Перезаливать резюме второй раз обычно лень.
Именно по-этому эффективность такого фильтра высока в нашем случае.
Я полностью с вами согласен, что на каком-нить форуме, где посты льются реками, эти меры вообще не пройдут.
Регулярка будет работать не совсем корректно, ну например, я опубликую ISBN и если вы отбиваете через \s начало слова, то посмотрите на \b и по хорошему почитайте фридела
Вы не правы, это не когда на вопрос как сделать что то линуксойды говорят man blah
Фридл, это действительно хорошая книга по регуляркам, у вас объективности ради обе регулярки не очень, вы же не попытались даже приложить мозги (простите но это так), вместо того, что бы попытаться поразмышлять
Предположим нужно порезать телефон, возьмём для объективности Россию (можно адаптировать)
+7 912 1234567
8 (912) 1234567
8-912-123-45-67
8 912 123 4567
наверное основные варианты, писать идиотов «восемь 912 один 23 четыре 567» не думаю, что будет много, но вы их не сможете порезать, будет разумней написать
т.е. у нас всегда номер начинается на 8 или +7 а потом 10 цифр с разделителем пробле, тире и иногда числа в скобках, /
(?:\+7|8)
([- ()]*\d){10}
/x
вот и будет наш номер без скобок конечно в, можно дальше добавить и скобки именно в нужные места (открывающую можно вынести смело после восьмёрки) достаточно мозг включить и всё будет как надо
я бы порассуждал, но это во флейм превращается, если про cpan посмотрите что нибудь на тему Email::Valie (не уверне, но вроде, я на выход) а вообще, всё же возьмите фридела, бумажная стоит рублей 300 электронную можно найти бесплатно, я видел в chm & pdf
Поиск скрытых контактов регулярными выражениями