не так заголовок/название этого пункта.
это не «шестнадцатиричное число» а RGB-цвет, в том виде, как он пишется в HTML.
т.е. в виде шести или трех разрядного шестнадцатиричного числа.
а само число может иметь сколько угодно разрядов — и один, и пятнадцать, и сто, но эта регулярка его ессно не пропустит.

vdasus 13 авг 2009 в 03:54

всё таки «шестнадцатЕричный»

susanin 12 авг 2009 в 22:47

3. Пароль
Паттерн: /^[a-z0-9_-]{6,18}$/

ненавижу когда меня ограничивают в выборе символов пароля, так этот пример не очень полезный :)

+35

НЛО прилетело и опубликовало эту надпись здесь

brainerazer 13 авг 2009 в 23:48

Тогда получится максимум два юзера не-гика :)

Stalker_RED 12 авг 2009 в 23:02

и более того, эта регулярка не позволит ввести в пароль спецсимволы, которые, в общем-то, маст хэв.

susanin 12 авг 2009 в 23:32

об этом я и написал

Silenius 14 авг 2009 в 04:06

В результате получается проверка на недопустимый пароль, ага!

xlam 12 авг 2009 в 23:09

Согласен с вами. Пользуюсь hotmail, использую 20-символьный пароль. Недавно решил воспользоваться Windows Live Messenger'ом, так он позволяет ввести только 16 символов! Как так?! Разные требования к паролю внутри одной и той же службы! Но что совсем меня удивило — несмотря на то, что мне не удается ввести пароль целиком, мессенджер успешно заходит под моей учетной записью.

susanin 12 авг 2009 в 23:33

это значит, что хранится только N первых символов пароля, остальные просто отбрасываются

ilya_compman 13 авг 2009 в 00:08

так они там даже не хэш хранят???

kottt 13 авг 2009 в 00:10

Я думаю, эти ограничения только на клиентской стороне и на сервере длина пароля может быть больше 16 символов

Goodkat 15 авг 2009 в 03:24

наоборот, на клиентской стороне ты хоть поэму туда впиши, но сервер возьмёт только первые 16 символов

Guria 13 авг 2009 в 13:14

хеш, но не от всего пароля а от максимально-возможной (по требованиям ресурса) его части

homm 13 авг 2009 в 08:34

А я больше ненавижу ограничение на 6 символов. Кто это придумал, почему именно 6?

igorekk 13 авг 2009 в 10:50

Объём памяти среднестатистического пользователя :)

gribozavr 13 авг 2009 в 12:11

Ну как же, сейчас практически все пароли обычных пользователей состоят из 6 цифр. По две цифры на день, месяц и год рожения :)

intnzy 13 авг 2009 в 12:23

скорее всего дело в том, что установлено, что среднестатистический человек может эффективно запоминать не более 7 объектов в совокупности одновременно. Видимо, этот предел-1. Дабы не подходить к порогу.

Goodkat 15 авг 2009 в 03:25

вообще никакие ограничения не нужны, даже пустой пароль — это пароль

l2k 13 авг 2009 в 09:33

тем более вот это /^[\w_]{6,18}$/

q_styler 13 авг 2009 в 11:38

Единственный верный паттерн для пароля: /^.{6,}$/

Goodkat 15 авг 2009 в 03:27

/^.*$/

Napolsky 12 авг 2009 в 23:02

регулярные выражения взрывают мой мозг, но без них никуда :(

nini 12 авг 2009 в 23:29

Купил на выходных книгу по регекспам, обьясняется все с самых основ до подробного разбора в конкретных ЯП. Очень помогает, в отличие от многочисленных «туториалов» в интернете (как и эта статья впрочем то же).

desecho 13 авг 2009 в 01:13

Какой автор и название книги?

nini 13 авг 2009 в 01:27

Моя книга на немецком:
www.amazon.de/Regul%C3%A4re-Ausdr%C3%BCcke-kurz-Tony-Stubblebine/dp/3897215357/ref=pd_bxgy_b_text_b

оригинал:
www.amazon.de/Regular-Expressions-Pocket-Reference-OReilly/dp/0596514271/ref=pd_bxgy_eb_text_b

luminox 26 авг 2009 в 01:06

Регулярные выражения, 3-е издание
www.books.ru/shop/books/592346

sielover 13 авг 2009 в 00:09

Почитайте „регулярные выражения“ в дискретке. Надежнее взорвет)

Napolsky 13 авг 2009 в 00:50

знаете, вокруг и так хватает того, что взрывает мозг, чтобы еще дополнительно что то искать :)

Beerlander 12 авг 2009 в 23:03

Если мне память не изменяет, то в e-mail адресе в имени ящика может быть символ "+", поэтому корректнее начало выражения записать: /^([a-z0-9_\.-\+]+)@

+12

jeje 12 авг 2009 в 23:24

Какие сервисы позволяют такое делать? Еще ниразу не видел

-6

НЛО прилетело и опубликовало эту надпись здесь

rukeba 12 авг 2009 в 23:31

gmail такое может. он игнорирует всё после плюсика, для него
user+foobar@gmail.com == user@gmail.com
rukeba.com/blog/2008/03/13/imena-pochtovyh-yashikov-v-gmail/

egge 12 авг 2009 в 23:49

прийдется соблюдать стандарты ;)
www.ex-parrot.com/pdw/Mail-RFC822-Address.html

Avg00r 21 авг 2009 в 16:09

Этот регэксп проглатывает вот это: mail@mail.

gribozavr 12 авг 2009 в 23:07

Спасибо, не нужно. Эти регекспы более вредны, чем полезны. Про ограничение пароля уже сказали. А я скажу про email и URL. local-part email'а (то, что до @) может содержать, например знак "+". И ещё много чего она может содержать. Вот правильный regexp: www.ex-parrot.com/~pdw/Mail-RFC822-Address.html

URL regexp так вообще смешной. Он не матчит более половины всех URL'ов в интернете. В url-path части этот regexp не разрешает символы =, &, %.

В общем читайте RFC, осмысливайте материал, который переводите. А то потом в интернете полурабочие сайты появляются на таких регекспах.

+24

Stalker_RED 12 авг 2009 в 23:22

>более вредны, чем полезны
но зато толково и понятно расписано какой символ что делает. для обучения покатит, а для реального использования но очень :/

Stalker_RED 12 авг 2009 в 23:22

*не очень

kottt 13 авг 2009 в 00:13

Почитайте лучше вики по регекспам — там коротко и по существу

xonix 12 авг 2009 в 23:31

хотел написать такой же комментарий, но лучше плюсану Ваш )
полностью согласен, что валидировать урлы/емейлы/ а тем более хтмл/хмл (вложенные структуры по определению не «регулярны») регекспами — не правильно… если попытаться правильно — слишком сложные регекспы получатся, проще уж конечный автомат использовать, или грамматики…

Nightquest 12 авг 2009 в 23:10

Перевели бы картинки

Lans 27 авг 2009 в 04:44

Как раз этим занимаюсь)

xlam 12 авг 2009 в 23:14

Как показывает практика, лучше не использовать нижнее подчеркивание в имени пользователя, особенно в веб ресурсах.

allter 12 авг 2009 в 23:20

> URL:… ([\/\w \.-]*)*

И вот потом, начитавшись таких статей, люди пишут «хабрапарсеры», которые не понимают в качестве URL`ов ни скобки (круглые и квадратные), ни процент-кодирование, ни банальные "?", "&", ";" и "#", которые уж точно используются в подавляющем количестве URL`ов.

ZIJ 12 авг 2009 в 23:36

Цель статьи — не написать абсолютно универсальные регэкспы, а наглядно показать принципы работы и дать простейшие решения. Если человек понял, как они работают — он допишет и матчинг пары спецсимволов. Много полезной инфы — здесь

glorybox 13 авг 2009 в 00:30

это наглая ложь. цель статьи дать быдлокодерам готовую регулярку под видом полезной обучалки

+20

Ferroman 13 авг 2009 в 14:39

Ай маладЭц! Не в бровь, а в глаз, как говорится.

Castle 13 авг 2009 в 00:43

Чтобы понять регекспы надо книжки читать и умные статьи, а не готовые патерны. Чего вам и советую, т.к. извините, но у вас каждая вставка «от себя» не соответствует первоначальному патерну(только вашу вставку с ip-адресом не проверял, ибо в такой извращённый патерн даже лезть не хочется). Да и приведенные патерны далеко не идеальны и не так общеприменимы как выдаются.

Почитайте на досуге Фридла.
Ещё раз, извините, если обидел.

seriyPS 13 авг 2009 в 16:39

хабрапарсер хабрапарсер…
code.google.com/p/jevix/

thecoder 12 авг 2009 в 23:38

Вставлю свои три копейки за протокол.
Без протокола валидный адрес будет //www.ya.ru — в вашу регулярку не пройдет.
С одним слешом — адрес от корня текущего хоста, с двумя слешами впереди — указание на домен. Перед всем этим опциональный протокол,
а после двух слешей может быть еще user:password@, что также весьма часто используется.

Castle 12 авг 2009 в 23:48

>> /^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/

А как же метасимвол \d? чуть волосы дыбом не стали)

>> От себя: более кратко — /^[\w_]{6,18}$/. Аналогично для юзернейма.

\w — про поддержку юникода этим метасимволом забыли :) По крайней мере в некоторых диалектах

>> /^([\w\._]+)@\1\.([a-z]{2,6}\.?)$/

Домен первого уровня должен совпадать с именем ящика? Либо я спросони туго соображаю? :)

ещё пару мелочей есть :)

ZIJ 12 авг 2009 в 23:54

спасибо, поправил в отсебятине. но основной паттерн оставил — чтобы была связь с картинкой :)

-1

Castle 13 авг 2009 в 00:32

ещё с ip адресом было бы нагляднее и красивее еслиб привели что-то типа:
$re = qr/25[0-5]|2[0-4]\d|[01]?\d\d?/;
$message =~ /($re\.){3}$re/;

olegkrasnov 13 авг 2009 в 00:44

Не вижу поправленного, \1

Co0l3r 12 авг 2009 в 23:52

объяснение регекспов это хорошо, хоть это уже и много где есть, чем дальше тем проще и понятней становится

KorP 12 авг 2009 в 23:52

регэксп вызывает в моём мозге просто взрыв, вродь всё просто, но когда начинаешь что то ковырять… как я наломал голову когда регэкспом выдирал данные из логов сервера, страшно вспомнить :) но надо

dazed 12 авг 2009 в 23:58

RegExp'сы лучше использовать как write-only, т.к. у каждого свой стиль и под свою специфику написаны.

Очень хорошо понимаются на практике, но нужно на 100% представлять как они работают, что с помощью него нужно сделать и тогда он незаменимый помощник ;)

-1

KorP 13 авг 2009 в 00:05

да я даже и не спорю, поковырявшись я уже давно понял что проще курить ман и пробовать самому, чем найти нечто подходящее в сети :)

glorybox 13 авг 2009 в 00:32

вот откуда такие советы берутся? =\

откройте perl best practices — там целый раздел посвящен регуляркам и доступно написано как аккуратно писать поддерживаемые регулярки

dazed 12 авг 2009 в 23:55

кстати во всех примерах букву будут подходить только в нижнем регистре.

Для любого регистра нужно писать либо [A-Za-z] либо включить флаг i

НЛО прилетело и опубликовало эту надпись здесь

ZIJ 13 авг 2009 в 00:01

спасибо, исправил

noita_kronk 13 авг 2009 в 00:25

Часто бывают небольшие отклонения от этих простых случаев, например, когда логин должен начинаться с буквы латинского алфавита, не заканчиваться дефисом и не иметь двух дефисов подряд и т.п. Мне кажется, поэтапный разбор составления различных решений для каких-то более сложных примеров был бы интереснее.

А очередной разбор типовых — ну, не знаю. Не айс. ;-)

remal 13 авг 2009 в 00:29

Многие примеры не выдерживают никакой критики. По url, email и тп читать соответствующие RFC. Пароль вообще ограничивать никак не надо. А в имени пользователя еще может быть и пробел, к примеру. Обо всем этом уже написали.

Добавлю, что \w — это [a-zA-Z_0-9]. Символ "-" сюда не входит.

Ваше преобразование IP адреса явно неверное. Это сразу видно по \1. При более глубоком вглядывании видны и другие косяки.

Ценность данного перевода стремится к нулю во всех отношениях. Это явно не лучший туториал для новичков. Тут явно нет информации для профи. Тут нет никакого опыта, который можно перенять. Зачем было это переводить, кроме как из-за красивых картинок?

ZIJ 13 авг 2009 в 00:53

убрал ошибочный регексп, спасибо

Castle 13 авг 2009 в 01:07

Добавлю, что \w — это [a-zA-Z_0-9]
В большинстве случаев \w поддерживает юникод и там не только латинские буквы!

Castle 13 авг 2009 в 01:08

В первой строке цитировал. Извините.

gravy 13 авг 2009 в 00:47

ужасное нагромождение цветов, текстов, шрифтов и полосочек в картинках
ребус какой-то получился…

torkve 13 авг 2009 в 01:01

А еще ко всей вышеперечисленной критике добавлю, что использовать в разборе урлов символ "/" в качестве ограничителя — глупость, ведущая к чрезвычайному загромождению регэкспа. Почему-то очень многие авторы на всю жизнь запоминают, что "/.../" — это регэксп, и никто не задумывается об использовании в качестве ограничителя другого символа.
Вместо вашего
/^(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?$/
получилось бы более-менее красивое (сам регэксп не рассматриваю)
#^(https?://)?([\w\.]+)\.([a-z]{2,6}\.?)(/[\w\.]*)*/?$#

Castle 13 авг 2009 в 01:14

Я всегда думал что поддержка различных ограничителей производится на уровне конкретного языка(к примеру Perl). Разве она осуществляется на уровне патернов???

Castle 13 авг 2009 в 01:16

Просто тут привязки к языкам нету.

torkve 13 авг 2009 в 10:16

Там, где эти ограничители есть — да (а тут они везде есть). Как правило — это перловские регэкспы, которые вы можете наблюдать в перле, пхп и других местах. В других регэкспах ограничителей нет вообще, например, в апачевском mod_rewrite или у grep. У vim ограничители не используются при поиске, но при замене вы набираете :%s#i#q#g, и ограничитель тоже можно менять.
В общем, везде, где я встречал ограничители, их можно менять, тем самым убирая ненужное экранирование.

Error_403_Forbidden 13 авг 2009 в 01:03

в начале ^ и в конце $ совершенно не нужен

-8

Error_403_Forbidden 13 авг 2009 в 01:23

ого! а минусаторы могут пояснить за что минусуют?

barbuza 13 авг 2009 в 13:12

за глупость

Error_403_Forbidden 13 авг 2009 в 01:28

я вот пишу так:
string RE;
RE = «productTitle\»>.+?\"(?.+?)\">(?.+?)by (?[^

Smerig 13 авг 2009 в 08:52

наверное нужно для того, чтобы не было валидации по подстроке?

Smerig 13 авг 2009 в 08:53

не минусил, я предположил, из-за чего могли минусы вбабахать

persei 13 авг 2009 в 11:53

Тогда будут проходить строки типа
БЛАБЛАБЛАvalid@mail.comБЛАБЛАБЛА
итд

stronciy 13 авг 2009 в 01:23

Вот если бы еще шпаргалку сделать! :)))

dioteos 13 авг 2009 в 01:57

Если вы ленивы — Вам сюда
Если уж очень ленивы — Вам сюда

Mandor 13 авг 2009 в 01:44

3. Пароль. Зачем ограничили набор символов и максимальную длину не понятно.
5. XML тэг. Регулярка не сработает на теге, в значении аттрибута которого есть символ ">" в кавычках, например: <input value=">>">. Понятно, что символы ">" должны преобразовываться в html-сущности, но тем не менее браузеры это нормально воспринимают, значит такая ситауция возможна.
6. E-mail. Надуманное ограничение доменом второго уровня. (На RFC ссылку дали выше)
7. URL. Свели все урлы до протоколов http/https. За что? Неужели других протоколов не существует (ftp://, svn://)? По вашим правилам в URL обязательно должна быть точка — выдуманное правило, а как быть с localhost или другими url указывающими на домены первого уровня (например в локальной сети такие могут быть). Как быть с url в виде ip-адреса (я уж не говорю про ipv6)?

pro 13 авг 2009 в 01:48

xml тэг:
про тег h1 автор видимо не слышал.
и про .*?

Sway 13 авг 2009 в 02:25

вот довольно хорошо, но не идеально работающая регулярка для xml/html:

/<(.+?)(?:\s+(.*?)>(.*?)</\1|>(.*?)</\1|\s*/)>/s

1. Ловит любые теги имеющие закрывающую часть или без нее.
2. Можно модифицировать первую выборку (.+?) для идеализации например так: ([\d\w_]+?)
3. Внутри словленного тега могут быть другие теги
4. Честно отработает для тегов, которые внутри себя не содержат одноименные закрываемые теги, т.е. если будет такое:

<div>
   <div>abc</div>
</div>

то регулярка словит первый же закрывающий div

-1

Sway 13 авг 2009 в 02:46

вспомнил еще про один тип тэгов, случайно мной забытый и вот модификация:

/<(.+?)(?:\s+(.*?)>(.*?)</\1|\s*>(.*?)</\1|\s*/|\s+(.*?)/)>/s

для тех кому интересно как это работает и почему:

1) — получаем имя тега

<(.+?)

2) — группа, которая не будет словлена, т.е. в результирующем массиве ее не будет

(?:\s+(.*?)>(.*?)</\1|>(.*?)</\1|\s*/|\s+(.*?)/)

2.а) — для тегов имеющих аттрибуты, тело и закрывающую часть

\s+(.*?)>(.*?)</\1

2.a.I) — получение аттрибутов

\s+(.*?)>

2.a.II) — получение тела

(.*?)

2.a.III) — закрытие тэга, одноименно для того, который словили в 1)

</\1

2.б) — для тегов на имеющих аттрибуты, но имеющих тело и закрывающую часть

>(.*?)</\1

2.б.I) — закрытие открывающего тега (у него не аттрибутов)

\s*>

2.б.II) — смотреть 2.a.II)
2.б.III) — смотреть 2.a.III)
2.в) — для тегов, не имеющих закрывающей части и аттрибутов

\s*/

2.г) — для тегов, не имеющих закрывающей части, но имеющих аттрибуты

\s+(.*?)/

3) — закрытие тега

-1

Sway 13 авг 2009 в 03:09

для тех кто еще не знает:
В моей регулярке постоянно используется особая запись:

.*?

Вон тот вопросик в конце делает очень полезную операцию: лишает квантификаторы "+", "*" и {число,} жадности. Т.е. в обчном случае для получения внутренностей тега регулярка "<(.*)>" съест всё, что ей дадут от первого символа "<" аж до последнего ">":

abc<div class="x"><any_tag/></div><any_tag/>abcd

на выходе даст:

div class="x"><any_tag/></div><any_tag/

А нам ведь нужно только

div class="x"

Вот для получения того, что нам нужно и используется знак вопроса после квантификаторов "+", "*" и {число,}
регулярки

<(.*?)>

<(.+?)>

<(.{2,}?)>

добросовестно выдадут

div class="x"

НЛО прилетело и опубликовало эту надпись здесь

Sway 13 авг 2009 в 16:35

эхх… нельзя делать добро — оно не остается безнаказанным =)

кстати, в регулярке автора вот такой вот тег:

<img src="sd"/>

словлен не будет. там предполагается наличие пробела перед "/", т.е. нужно не \s+, а \s*

dioteos 13 авг 2009 в 01:53

А где же квантификаторы? Если цель статьи хотя бы кого-то научить — надо было бы добавить немного отсебятины.

dimavs 13 авг 2009 в 04:28

Regex емейла по RFC 822

sharkman 13 авг 2009 в 07:21

Кстати, это единственный правильный регексп для e-mail, из представленных здесь.
Просто бесит, когда ставишь какой нибудь продукт, а в нём невозможно ввести локальный адрес, что-нибудь типа: vasia@work.

bloodmoon 13 авг 2009 в 05:09

Надо собратся и выучить эти выражения.

dimavs 13 авг 2009 в 07:30

Some people, when confronted with a problem, think «I know, I'll use regular expressions.» Now they have two problems. ;-)

dimavs 13 авг 2009 в 07:31

Я, собственно, не отговариваю учить регулярные выражения. Просто предупреждаю :-)

ceesaxp 13 авг 2009 в 07:40

Еще неплохо оригинальное авторство упоминать: net.tutsplus.com/tutorials/other/8-regular-expressions-you-should-know/

ZIJ 13 авг 2009 в 13:19

Оно с момента публикации неплохо упомянуто — внизу топика «Взято отсюда»

chiaroscuro 13 авг 2009 в 07:53

Хабр катится в… ну вы понели.

jandosul 13 авг 2009 в 08:24

Может я быдлокодер но автору спасибо!

-3

Bonch 13 авг 2009 в 08:50

Часть ЧПУ проще и надежнее распознавать так:

#^[^/]+$#

Статья пафосная и ни о чем.
Читайте Фридла.

lugansk 13 авг 2009 в 11:27

#^[^/]+$#

Тогда уже

#[^/]+$#

Иначе в любой ссылке не будет совпадения из-за имеющихся там слэшей.

Bonch 13 авг 2009 в 12:07

Точно

django 13 авг 2009 в 10:49

Спасибо конечно, но вряд ли это кому-то действительно нужно. Тем кому нужны разные жизненные примеры — на www.regexlib.com их тонны.

recoilme 13 авг 2009 в 10:59

Мой вариант процессинка простых ссылок а ля http… и ссылок на картинки в картинки. Работает если текст начинается с ссылки, корректно обрабатывает большинство ссылок на всех моих проектах (корректнее хабра, к примеру).
Оборачивает линки в ноиндекс/нофоллоу (снижая привлекательность прямых ссылок для сеорастов).
Язык — PHP.

$processedtxt = preg_replace_callback(
"#[^(\"')]?[hHtTpP]{4}[:]\/\/[a-zA-z.\/0-9-+?=&%\#;]*#",
create_function('$matches',
'$pos = strpos(strtolower($matches[0]),«http»);$first=\'\';'.
'if ($pos == 1) {$first=substr($matches[0],0,1); $matches[0] = substr($matches[0],1);}'.
'$ext= substr(strtolower($matches[0]),strlen($matches[0])-3);'.
'if ($ext == «gif» or $ext == «jpg» or $ext == «png») return "";'.
'else return "$first$matches[0]";'),$text);
return $processedtxt;

-1

Castle 13 авг 2009 в 11:03

/i вам в помощь :)

recoilme 13 авг 2009 в 14:40

в смысле?

-1

НЛО прилетело и опубликовало эту надпись здесь

recoilme 13 авг 2009 в 18:41

А, вы про модификаторы… Нет уж, спасибо.
Во первых через них лёгким движением руки вставляют экспойты: www.bugs.php.net/bug.php?id=35960 (и не только в пхп)
Во вторых в их обработке в пхп встречаются баги. Пол дня колупался не мог понять почему регулярка не работала. Весь инет перерыл. Выяснилось — баг пхп с модификатором.
Вобщем обжёгся один раз, и с тех пор как то по босяцки предпочитаю.

-2

recoilme 13 авг 2009 в 18:46

Сори, правильная ссылка будет: bugs.php.net/bug.php?id=35960
Кстати использовал баг в парсере урлов хабра, позволяющий преобразовывать ссылки с www заминусованным товарищам типа меня, но не обратил внимания что это субдомен.

-1

meettya 14 авг 2009 в 22:02

Потратил пол-минуты на хождение по ссылке. Повеселили, чесслово.
Вы, юноша, вместо того чтобы полную ерунду писать — лучше потратьте время на то, чтобы прочитать ответ умных людей, да осознать его.
Резюме ответа саппорта — модификатор '/e' позволяет выполнять код в шаблоне подстановки(замены), как это и указано в документации.
Приведенный Вами код выполняет ровно то, что Вы написали, а не то, что Вы подразумевали при его написании. Именно в этом корень Ваших «багов».

Что же до использования регулярных выражений и модификаторов — все они абсолютно безопасны и не содержат никаких «багов» и «дыр». Во всяком случае до тех пор, пока разработчик сам их туда не внедрит, мало ли какие у него идеи.
В бесконечной рекурсии тоже иногда бывает смысл, знаете ли.

Spearance 13 авг 2009 в 14:37

По-моему эти регекспы ужасны. Как минимум не оптимальны, как максимум бесполезны.

в этом правиле дефис в квадратных скобках лучше перенсти в начало
/^[a-z0-9-]+$/

meettya 14 авг 2009 в 17:05

Вот я не понимаю, зачем пытаться учить на плохих примерах?

Не надо так:

4. Шестнадцатиричный цвет
Паттерн: /^#?([a-f0-9]{6}|[a-f0-9]{3})$/

Надо вот так:
Паттерн: /^#?(?:[0-9a-f]{3}){1,2}$/

Если Вам нужно найти 3 или 3+3 последовательностей — так и скажите.

PS. Вот чего я никак не пойму — это почему в символьном классе последовательность задается «тире», а в полном квантификаторе — через запятую? Инопланетная логика.
Кстати, использование в квантификаторе логики «последовательность» или «список» позволила бы делать подобные вещи более красивыми. Жаль, что синтаксис уже точно не изменится.
Если помечтать, то было бы [a]{1-3} — от 1 до 3-х 'a' или [a]{1,3} — точно 1 или точно 3 'a'. Красота!

GooRoo 6 сен 2009 в 22:19

Как насчет такого URL:

ftp://admin:megapass@ftp.someserver:5555/~blabla/megafile.rar

Homakov 24 дек 2011 в 21:47

безсмысленная статья. человек который их раньше не понимал и не будет понимать, а тот который толком прочитал теорию не найдет ничего нового(подстановки из карманов \1 нету, поз. или негатив. поиск вперед назад без кармана — нету

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

8 полезных регэкспов с наглядным разбором

Комментарии 119

Публикации

Истории