ssotnikov25210 авг 2024 в 15:28

Атрибут charset и важность его использования

Простой

9 мин

Информационная безопасность * Веб-разработка *

Из песочницы

Перевод

+32

Комментарии 7

qw1 10 авг 2024 в 22:43

Вообще странно что причиной проблемы тут указывается отсутствие encoding.
Настоящая причина - весь пользовательский ввод, отображающийся в HTML, должен проходить через escape-фунцию, которая заменит <script> на < script >, а коды типа 0x1b на . Если так сделать, то и отсутствие encoding не позволит что-то эксплуатировать.

Просто добавление encoding не закрывает XSS-инъекции, при отсутствии экранирования пользовательского ввода. То есть, слона то вы и не заметили.

DarthVictor 11 авг 2024 в 05:53

Вы много знаете escape-фунций, которые чистят ввод в японской кодировке? С точки зрения стандартной escape-фунции ввод абсолютно чист. В нём символ йены и пара иероглифов.

qw1 11 авг 2024 в 06:22

На SO этот вопрос разобран (к сожалению, ответ не помечен как верный)

OWASP recommends that "[e]xcept for alphanumeric characters, [you should] escape all characters with ASCII values less than 256 with the &#xHH; format (or a named entity if available) to prevent switching out of [an] attribute." So here's a function that does that, with a usage example:

function escapeHTML(unsafe) {
  return unsafe.replace(
    /[\u0000-\u002F\u003A-\u0040\u005B-\u0060\u007B-\u00FF]/g,
    c => '&#' + ('000' + c.charCodeAt(0)).slice(-4) + ';'
  )
}

Dren0r 12 авг 2024 в 10:10

По-моему, все топ фреймворки имеют санитайзеры из коробки, вставкой квери параметров напрямую в джс можно удивить студента на 1 курсе. В реальных же проектах все делается само и никакие экранирования не нужны.
Переменные из юрл отобразятся просто как текст, а не рендер html/js.

DarthVictor 14 авг 2024 в 08:30

Так какие санитайзеры из коробки экранируют символ йены? И каким символом они это экранируют? У вас без точного указания кодировки понятие спец.символа и экранирующего символа может меняться.

qw1 14 авг 2024 в 09:11

Не надо цепляться за символ йены. Проблема в коде 0x1B, и этот код чисто управляющий, как табуляция или перевод строки, даже не имеет знака в unicode. Все управляющие символы (коды 00-1F) надо обязательно экранировать.

Psychosynthesis 26 ноя 2024 в 22:47

Написано косноязычно максимально, конечно...

Проблема-то изначальная в кривой фильтрации пользовательского ввода, а не в кодировке.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий