regeda Sep 28 2009 at 02:14

Не очередной XSS фильтр

2 min

8.4K

Website development*

+19

Comments 61

remal Sep 28 2009 at 02:31

Я бы при помощи Tidy приводил бы ввод к XML, а дальше можно при помощи того же самого XSLT прибивать лишнее.

corristo Sep 28 2009 at 04:01

code.google.com/p/jevix/

Kakysha Sep 28 2009 at 09:06

Пробовал Jevix & htmlpurifier. Остановился на jevix'e, который опказался гораздо понтянее и проще и легче (заметно легче). Алco присутствует полезная связка Jevix'a и Geshi(подсветка кода) + video парсера, и все это в одной библиотеки дял CI: www.coolweb.su/blog/7.html

eugeneorlov Sep 28 2009 at 08:09

htmlpurifier

dienow Sep 28 2009 at 13:05

Warning: Element '<style><a>' is not supported (for information on implementing this, see the support forums) in /home/ezyang/htmlpurifier.org/live/library/HTMLPurifier/HTMLDefinition.php on line 265
К тому же мне работать с white list не так удобно как с black list.

regeda Sep 28 2009 at 13:38

Если

regeda Sep 28 2009 at 13:39

если <style> еще можно понять, то что плохого сделал старый добрый <a> ???

dienow Sep 28 2009 at 13:58

Видимо плохо ему стало именно от style, с «a» без «style» у него всё хорошо.

eugeneorlov Sep 28 2009 at 22:46

black list — зло, т.к. все возможные дыры предусмотреть невозможно.

dienow Sep 29 2009 at 11:27

Да, постепенно прихожу к тому же выводу. Хоть blacklist и whitelist у меня в разы, обрезать редкий тэг меньшая беда чем пропустить вредоносный код. Честно говоря, до прочтения вот этого ha.ckers.org/xss.html я и не представлял что xss атаки бывают настолько разнообразны.

egorinsk Sep 28 2009 at 22:58

А вы можете написать 100%-ный black list?

dienow Sep 29 2009 at 11:30

Не могу, согласен с Вами. Я просто знал о некоторых хитрых способах обойти защиту, но не знал что их так много =( Теперь уже склоняюсь к white list.

boston Sep 28 2009 at 08:43

Старенький, но проверенный phpinputfilter

tenshi Sep 28 2009 at 10:20

-moz-binding

regeda Sep 28 2009 at 11:28

Данная фича тоже фильтруется

tenshi Sep 28 2009 at 13:48

а сколько их ещё не фильтруется…

tenshi Sep 28 2009 at 10:35

> Кому интересно поучавствовать в проекте или взломать XSS-фильтр, пишите в личку.
создай страничку с песочницей…

LMaster Sep 28 2009 at 20:02

dev.plakmag.ru/xss:
&lt/textarea&gt &lt script&gt alert('xss');&lt/script&gt
(удалите пробелы).

regeda Sep 28 2009 at 20:06

Ну максимум, Вы украдете свои данные.

LMaster Sep 28 2009 at 20:09

Почему? Контекстно загрузить страницу с передачей POST-параметра и последующим воровством cookies никто не отменял.

regeda Sep 28 2009 at 20:11

OK! Обновлено

recompileme Sep 28 2009 at 22:18

вот такие ссылки проходят в фф
ой, не знаю пустит ли фльтр хабра))
XSS

recompileme Sep 28 2009 at 22:27

гыгыгы
1

-1

recompileme Sep 28 2009 at 22:32

хабр не пропустил)
А ваш — пропустил вот такой xss

Вобщем не стило хаять кодеигнайтер. Его защиту я так и не смог пробить, а ваша свалилась через 10 минут

regeda Sep 28 2009 at 22:40

Я CI не хаял, а просто показал один пример. Благодаря Вашему фидбеку данная уязвимость будет устранена ))

regeda Sep 28 2009 at 23:31

Обновлено! Значения в аттрибутах @href @src пропускаются через «rawurldecode»

recompileme Sep 29 2009 at 11:01

т.е. сразу выведите читсый javаscript вместо непонятных символов?
Библиотека для фильрации XSS в codeigniter совсем не зря заменяет javаscript на [removed] Совсем. Не зря. Вы слишком самоуверены мне кажется. Не разобравшись толком раскритиковали выбранный кодеигнайтером метод и предложили свой, не потрудившись даже прогнать его через топ 500 xss скриптов.

regeda Sep 29 2009 at 11:58

если у Вас есть на руках Ваш топ 500, то милости прошу на обозрение.
А чистый javascript, конечно же, не пропускается ;)

recompileme Sep 29 2009 at 12:20

ha.ckers.org/xss.html

regeda Sep 29 2009 at 12:28

Этот ТОП использовался как отправная точка для написания фильтра, все примеры проверялись на корректное преобразование

egorinsk Sep 29 2009 at 00:25

А разве такой способ работает в браузере? Это вообще уязвмость?

regeda Sep 29 2009 at 00:34

Скорее всего нет…
Во всяком случае Opera 10 не преобразует %3C в < или %3A в двоеточие

egorinsk Sep 29 2009 at 01:50

Дык а смыл тогда блокировать? давайте теперь и русское слово «яваскрипт» банить :) Вот за этои не люблю эти фильтры — работают бестолково, видимо единтвенный нормальный способ — разрираьть текст по тегам/аттрибутам/виду ссылки и пересобирать заново.

regeda Sep 29 2009 at 11:59

Если надо будет банить «яваскрипт», то будем банить

Isis Sep 28 2009 at 22:31

recompileme Sep 28 2009 at 22:33

знакомые всё ники)

Isis Sep 28 2009 at 22:33

Простите,

<img src='http://ya.ru/logo.gif'bo=o"onload="alert();>

regeda Sep 28 2009 at 22:43

Спасибо за пример

regeda Sep 28 2009 at 23:26

Обновлено! Теперь в unquoted значениях аттрибутов все двойные кавычки экранируются.

<img src='http://ya.ru/logo.gif' bo="o\"onload=\"alert();" />

FloppyFormator Sep 29 2009 at 02:41

Ещё вот такая штука прокатывает:

<img src="http://ya.ru/logo.png" style=color:red;"onload=alert('XSS!');a="1>

FloppyFormator Sep 29 2009 at 02:52

Адский парсер! Я имел в виду вот это: <img src="http://ya.ru/logo.png" style=color:red;"onload=alert('XSS!');a="1>

FloppyFormator Sep 29 2009 at 02:58

Ох ты ж ёканый бабайка, получите-ка лучше картинку:

pxx Sep 29 2009 at 11:37

Вы не могли бы пояснить, благодаря чему этот код сработает?
Я в XSS не силен, поэтому мне он с виду кажется абсолютно безумным и не дееспособным.

regeda Sep 29 2009 at 12:26

Как показала практика и примеры других участников, экранирование — не лучший способ, поэтому двойные кавычки в unquoted значения аттрибутов заменяются на "

regeda Sep 29 2009 at 12:29

фу-ты, ну-ты на & quot;

artyfarty Sep 28 2009 at 22:54

ооо.
Я покажу вам страшную вещь — презентацию с конференции BlackHat.
Когда я её прочитал, я полчаса сидел в шоке.

Оригинальный линк лежит, поэтому перезалил к себе: artyfarty.ru/blackhat_xss.rar

Советую всем хабраюзерам ознакомится. Вообще, сиё творение достойно топика-ссылки или топика-перевода.

artyfarty Sep 28 2009 at 22:56

Спойлер:

(É=[Å=[],µ=!Å+Å][µ[È=-~-~++Å]+({}+Å) [Ç=!!Å+µ,ª=Ç[Å]+Ç[+!Å],Å]+ª])() [µ[Å]+µ[Å+Å]+Ç[È]+ª](Å)



($=[$=[]][(__=!$+$)[_=-~-~-~$]+({}+$)[_/_]+($$=($_=!''

+$)[_/_]+$_[+$])])()[__[_/_]+__[_+~$]+$_[_]+$$](_/_)

Это тоже xss-вектор. Я правда до конца не понял принципа именно этой техники, но там и других извращений мама мия.

egorinsk Sep 29 2009 at 02:01

Это не вектор, это кусок кода на яваскрипте, отличающийся от нормального тем, что в нем не ипользуюстя симолы [a-z0-9], только и всего. Попробуйте этой фигней что нибудь взломать.

artyfarty Sep 29 2009 at 02:02

Адресуйте это автору презентации. Как я написал, я сам не до конца понял, как это применить, но выглядит впечатляюще :)

insa Sep 28 2009 at 23:08

Сходу бага в обработке IE «expression», по мотивам onsec.ru/vuln?id=5

regeda Sep 28 2009 at 23:51

Обновлено! IE «expression» фильтруется даже если каждый символ экранируется символом \ или C-подобным комментарием /*XSS*/:

style="onsec:e\x\p\re\s\s\i\o\n(alert('XSS'))"

или

style="onsec:e/*XSS*/x/*XSS*/p/*XSS*/re/*XSS*/s/*XSS*/s/*XSS*/i/*XSS*/o/*XSS*/n(alert('XSS'))"

insa Sep 29 2009 at 00:18

Остается только пожелать успехов в этом неравном бою с бесконечностью :)

Becoming_Insane Sep 29 2009 at 00:54

Странно, никто не вспомнил про htmLawed, а ведь он, имхо, достаточно крутой соперник и джевиксу и саксу и инпутфильтру.

вывод сделан опытным путем, вставвляя дескрипшены айтемов с ебэя и смотря на то, что в итоге приходит.
надо было чтобы всё было один в один, тока без опасных элементов. (не все дескры подходили, т.к. в некоторых менюхи генерились динамически ЖС-ом. на такие забивали)
сначала юзали джевикс, но он подвел, потом сакс, подвел, вернули джевикс — и там карачун.
да и у джевикса рекурсивный вывод жрал много памяти при дереве > 20-и нодов, при этом пхп сначала умирал с ошибкой нестед левел 100 ричед

artyfarty Sep 29 2009 at 01:55

Мне стукнул в аську человек, не имеющий аккаунта тут (32523553), и попросил выложить ещё одну строку, обходящую фильтр:
<img src='o.gif'bo=o"onerror=alert();//>

Он очень желает присоединится к дискуссии и ищет инвайт. У меня, увы, инвайта нет.

Он какбы говорит нам: «экранизация там не играет роли. в прошлом рабочем варианте она помогла только потому что перед знаком равно возник слеш»

cdbrk Sep 29 2009 at 10:26

Если пропускать html-тэги, то вероятность xss всегда будет существовать.
Почему бы не использовать bb-код?

regeda Sep 29 2009 at 13:29

А если используется WYSIWYG редактор? То HTML нужно преобразовывать в bb-код, а потом обратно?

artyfarty Sep 29 2009 at 19:06

Так делает IPB.

egorinsk Sep 29 2009 at 18:21

В общем, по итогам обсуждения и четния ha.ckers.org, у меня такие мысли:

Фильтр автора — несовершенен, т.к. использует конечные автоматы (чтает по символу), что очень медленно, фильтрует по черным спискам (что также плохо, т.к. не предугадаешь все уязвимости).

Моя идея — надо делать одно из 2: 1) преобразовывать входные данные в дерево DOM, и проходить по нему белым списком, затем пересобирать уже валидный и безопасный HTML 2) чтобы побыстрее делать — парсить регулярками на теги/аттрибуты/текст и опять же, проходить белым списком, и пересобирать заново. Ключевое слово — пересобирать, чтобы обезвредить выходной код. В этом случае всякие уязвимости с незакрытими тегами, двойными скобками и прочими нарушениями синтаксиса просто превратятся в безвредный обычный текст.

regeda Sep 29 2009 at 19:05

Идея с белым листом мне очень нравится, скорее всего буду развивать защиту в этом ключе.
Изначально алгоритм с конечным автоматом заложен для реализации как php extension, что будет крайне быстро.
Если по-Вашему итог в обсуждении и поставлен, то в развитии кода ставится «to be continued».

egorinsk Sep 30 2009 at 04:45

Так объясните хоть, чем ваш способ, медленно ковыряться по одному символу, лучше идеи разрезать регуляркой код на куски и их перебирать, а потом склеить назад?

regeda Sep 30 2009 at 13:49

1. разрезание и фильтрация тегов идет в одном цикле без повторных действий.
2. повторюсь, что метод с конечным автомат (ковырянием по одному символу) заложен для реализации как php extension

Show the best of all time