Комментарии / Профиль Castle / Хабр

InfoSec

Подписчики

ПрофильСтатьи1ПостыНовостиКомментарии190

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 17:55

std и plus правлены мною.
Насчёт моего утверждение, что plus не съест пустые кавычки — я был не прав. Извините. Это всё моя невнимательность… Остальное вроде так как и говорил.
И кстати, выше я предлагал выражение "((?>[^"\\]*|\\.)*)". Тут грубейшая ошибка!) Думаю сами догадались какая :)

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 17:50

$str = ' cb «zero \» one\\\\" two \\\\\" free \\\\\\\\" four \\\\\\\\\" no!" ';
print "$str\n\n";
print «1) lazy2 < $1 >\n» while $str =~ m/"(.*?)"(?<!\\")/g;
print «2) plus < $1 >\n» while $str =~ m/"(([^"\\]+|\\.)*)"/g;
print «3) std < $1 >\n» while $str =~ m/"((?>[^"\\]+|\\.)*)"/g;
print «4) lazy < $1 >\n» while $str =~ m/"(.*?)(?<!\\)"/g;
print «5) unroll < $1 >\n» while $str =~ m/"([^"\\]*(?:\\.[^"\\]*)*)"/g;
print «6) ??? < $1 >\n» while $str =~ m/"(.*?)"(?<! \\")/g;

cb «zero \» one\\" two \\\" free \\\\" four \\\\\" no!"

1) lazy2 < zero \" one\\" two \\\" free \\\\" four \\\\\" no! >
2) plus < zero \" one\\ >
2) plus < free \\\\ >
2) plus < no! >
3) std < zero \" one\\ >
3) std < free \\\\ >
3) std < no! >
4) lazy < zero \" one\\" two \\\" free \\\\" four \\\\\" no! >
5) unroll < zero \" one\\ >
5) unroll < free \\\\ >
5) unroll < no! >
6) ??? < zero \" one\\ >
6) ??? < free \\\\ >
6) ??? < no! >

Интересная ошибка Perl-разработчика

Castle 15 авг 2009 в 13:29

согласен :)
Однако можно извратиться и снова получить инъекцию в split /$input:/
:)

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 13:07

извините, но выражение по вашей ссылке на мой субъективный взгляд некорректны :)
1) std
сохраняющие скобки захватывают не то что надо, +атомарная группировка и квантификатор должны немного улучшить дело :)
"((?>[^"\\]*|\\.)*)" — так мне кажется корректней. По идее и быстрее. Извините, щас проверить не могу, нет ничего под рукой…
2) lazy
"(.*?)(?<!\\)"
Как я понял он некорректен при выражении вида \\"
У lazy_2 та же проблема.
3) plus
не съест найдёт пустый строки ""

Получается только unroll валидный для отловки текста между двумя кавычками :) В нём вроде как всё выглядит нормально. По крайней мере на первый взгляд :)
Щас будем думать как и его улучшить. :)

Интересная ошибка Perl-разработчика

Castle 15 авг 2009 в 11:59

надо использовать особенности того языка, на котором пишешь. А иначе теряется вся прелесть того или иного ЯП.
Ниже промазал, извините :)

Интересная ошибка Perl-разработчика

Castle 15 авг 2009 в 11:58

надо использовать особенности того языка, на котором пишешь. А иначе теряется вся прелесть того или иного ЯП.

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 11:47

На регулярки было бы интересно взглянуть. В идеале и на хронометраж.

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 11:33

Можно поподробнее насчёт «грязного трюка»???

Интересная ошибка Perl-разработчика

Castle 15 авг 2009 в 11:14

Чем вам \Q… \E не нравится?

Основы здорового питания

Castle 15 авг 2009 в 10:36

ну вот… только на обед обжарил мясо… и картошечку на сале…

Несем игры в реальность

Castle 15 авг 2009 в 10:00

Вот бы ввели бои между игроками. Можно былоб в бою кастануть подзатыльник.

Общие советы по составлению оптимальных регулярных выражений

Castle 15 авг 2009 в 09:37

Ещё бы к важным я причислил управление компиляцией… интерполюцией… предварительным копированием…
Очень часто полезно применение атомарные группировки…

Вообще, не зная принципов работы НКА не стоит даже пытаться что-либо оптимизировать. Особенно в работе с квантификаторами :) Велик шанс того, что эффект будет обратным. Либо вообще измените результат работы патерна.

Общие советы по составлению оптимальных регулярных выражений

Castle 14 авг 2009 в 21:19

1 пункт оптимизаторы обычно правят сами :)

Новая уязвимость в ядре Linux

Castle 14 авг 2009 в 18:50

mplayer и pulseaudio у меня не стоит… второй скрипт работает…

Новая уязвимость в ядре Linux

Castle 14 авг 2009 в 18:15

Debian, 32 bit, работает.

8 полезных регэкспов с наглядным разбором

Castle 13 авг 2009 в 07:03

/i вам в помощь :)

8 полезных регэкспов с наглядным разбором

Castle 12 авг 2009 в 21:16

Просто тут привязки к языкам нету.

8 полезных регэкспов с наглядным разбором

Castle 12 авг 2009 в 21:14

Я всегда думал что поддержка различных ограничителей производится на уровне конкретного языка(к примеру Perl). Разве она осуществляется на уровне патернов???

8 полезных регэкспов с наглядным разбором

Castle 12 авг 2009 в 21:08

В первой строке цитировал. Извините.

8 полезных регэкспов с наглядным разбором

Castle 12 авг 2009 в 21:07

Добавлю, что \w — это [a-zA-Z_0-9]
В большинстве случаев \w поддерживает юникод и там не только латинские буквы!

1 2 3 4 5

7 8 9 10