HTML5 — взгляд через призму безопасности

    HTML5 — будущий стандарт языка разметки Интернет. Пока он находится в стадии черновика, но все больше и больше его возможностей реализуются в популярных веб-браузерах. Но как это обычно бывает, новые технологии несут в себе и новые опасности, которые могут быть успешно проэксплоитованы.


    HTML5: краткое резюме


    Многие, вероятно, уже наслышаны про противостояние кодеков для технологии встраивания видеороликов на страницах. С помощью тега <video> предполагается если не заменить, то как минимум составить серьезную конкуренцию Adobe Flash. Заводя разговор о HTML5, часто вспоминают именно это нововведение. Еще бы: такие гиганты видеохостинга как Youtube и Vimeo уже реализовали поддержку новой технологии. А мобильные продукты от Apple, в которых официальной поддержки Flash'а не было и, скорее всего, не будет, уже активно ее используют. Так что потоковое видео, вставленное в страницу с помощью тега <video>, — это то, что можно пощупать уже сейчас.
    Среди других «вкусностей», которые предлагает HTML5 стоит выделить:
    • «Оффлайн» хранение данных в браузере – веб-хранилище, локальные БД;
    • Canvas 2D API;
    • Междоменное взаимодействие (Cross Domain Messaging);
    • «Drag-and-drop»-функционал;
    • Работа с сетью с помощью веб-сокетов;
    • Определение местоположения (Geolocation).


    Веб-хранилище — мощная альтернатива кукам


    Нет ничего удивительного в том, что с приходом эры веб-приложений (как например Gmail) появилась необходимость в хранении массивов данных на стороне веб-браузера. Яркий пример тому — это попытки сделать возможной работу с такими веб-приложениями офлайн. В этом больших успехов добился Google со своей технологией Google Gears. Куки со своими лимитами (особенно по размеру в 4КБ) и методами работы с ними — явно неподходящее и устаревшее решение для подобных задач. По этой причине было решено разработать новый механизм, подобный кукам, но лишенный их недостатков. Им и стала технология WebStorage. В 2 словах, благодаря HTML5 мы теперь имеем хранилище (вернее два хранилища) вида «ключ-значение» на стороне веб-браузера с доступом из JavaScript:
    • localStorage — для долговременного хранения данных;
    • sessionStorage — для сессионного применения.
    Механизм поддерживается практически всеми веб-браузерами: Firefox 3.5, Safari 4.0, IE8, Google Chrome, Opera 10.50. Ниже приведён типовой пример использования локального веб-хранилища для учёта посетителей веб-страницы.

    <p>Вы просматривали эту страницу <span id="count">сколько-то </span> раз.</p>
    <script>
    if (!localStorage.pageLoadCount)
         localStorage.pageLoadCount = 0;
    localStorage.pageLoadCount += 1;
    document.getElementById('count').textContent = localStorage.pageLoadCount;
    </script>

    Давай посмотрим на сторону безопасности данной технологии. Как и многое в JS API в HTML5 подчиняется механизму HTML5 Origin, то есть данные доступны для всех страниц на одном домене с учетом протокола и номера порта (например, example.com:80). Как уже отмечалось выше, веб-хранилище избавлено от лимита в 4КБ и спецификация рекомендует использовать 5 МБ на домен. На деле же у Firefox, Safari, Opera, Google Chrome лимит равен 5МБ, у IE — 10МБ. Но самое интересное не в самой квоте, а в том, как браузер используют их.
    К примеру, в Firefox действует лимит на .example.com. Таким образом, (и тут внимание!) один поддомен может полностью занять место, отведенное для домена:

    // Firefox 3.6.8
    for (var i = 0; i < 100; i++) {
        try {
            localStorage.setItem(rand(1, 10000).toString() +  'foo'+i.toString(), 'AA...AA'+i.toString());
        } 
        catch (e) {
            alert(i.toString()+'|'+e);break;
            }
    }
    

    Не обошлось и без вездесущего null-байта. В данном веб-браузере вставка null-байта в ключ localStorage приводят к «забывчивости» Firefox. Иными словами место, хоть и всего в 1Б занято, но веб-браузер его не учитывает. «Мелочь, а приятно» (с).
    Идём дальше. Google Chrome пытается быть более строгим к ограничениям на домен и в расчете лимита учитывается полностью домен. Но в тоже самое время в Google Chrome можно занять вообще *всё* твое дисковое пространство, создав кучу айфреймов на wildcard-домен, в котором и забрать по 5МБ!

    for(var i=0; i<10; i++) {
        var iframe = document.createElement('iframe');
        iframe.src = 'http://'+randomString()+'.example.com/ddos.html';
        document.body.appendChild(iframe);
    }
    

    Этот баг до сих пор не исправлен. Помимо прочего от кук к новому виду хранилища перекочевали и старые проблемы, в том числе:
    • отслеживание пользователей;
    • DNS-спуфинг атаки.
    Из-за особенностей ограничения доступа (протокол+домен+порт) мы также имеем проблемы на хостингах, использующих систему example.com/~user/, чего к слову сказать с куками не было. Да, давно уже мы не встречали подобный хостинг в жизни, но вдруг!
    Стоит также отметить ещё одну важную особенность веб-хранилища — в отличие от кук на сервер ничего не передается в рамках привычных HTTP-запросов. Данные доступны только со стороны веб-браузера через JS API. Так же как и другие технологии, которые переносят большую часть работы веб-приложения на сторону веб-браузера, это повышает риски от традиционных уязвимостей вида XSS. И если раньше угоняли куки, то сейчас велик шанс угнать более «вкусные» данные, а в 5 МБ их уместить можно немало! Для сессионных кук, впрочем, появилась возможность сильно урезать их доступность с JavaScript с помощью атрибута HTTPOnly, и это хорошо. Но для WebStorage подобных механизмов не предусмотрено, и доступ будет полным.

    SQL-инъекция в веб-браузере


    Раз уж зашла речь про хранение данных вспомним и про ещё более продвинутое средство — веб-SQL база данных прямо в браузере! Пускай это и SQLite, но и это уже неплохо! Не будем подробно рассматривать достаточно специфичный синтаксис выполнения запросов к БД, а лучше сразу рассмотрим следующий код, который должен просто выводить информацию о книге по ее ID:

    function showById() {
        var pos = document.URL.indexOf("book=")+5;
        var bookId = document.URL.substring(pos,document.URL.length);
        var author = '';
        var title = '';
        db.transaction(function(tx) {
            tx.executeSql("SELECT * FROM books WHERE id = " + bookId, [], function(tx, result){
                if ( result.rows.length > 0) {
                    document.getElementById('bookAuthor').textContent =result.rows.item(0)['author'];
                    document.getElementById('bookTitle').textContent = result.rows.item(0)['title'];                        }
            }, function(tx, error){});
        });
    }
    

    А что будет, если перейти по адресу вроде следующего? target.com/html5/websql.html?book=1/**/AND/**/1=2
    Получаем DOMXSS+SQL-инъекцию! Жаль, что возможности по использованию данной уязвимости достаточно малы (кстати, Oxod написал хорошую статью про инъекции в SQLite, ссылку ищи внизу). Особенно с учётом того, что и Опера, и Хром хранят в отдельных файлах sqlite-базы для сайтов. Само собой авторы предусмотрели возможность и рекомендуют выполнять «безопасные» параметризированные SQL-запросы. Но посмотрим, как разработчики будут следовать их совету. Помимо прочего для веб-SQL баз характерны такие же проблемы, как у localStorage и sessionStorage.

    Новые теги и атрибуты — обновляем базы сигнатур IDS и WAF


    В HTML5 добавились новые теги и атрибуты — это значит, что пора обновлять правила/сигнатуры твоих WAF (мы подробно писали о файрволах для веб-приложений них в статье «Горящие стены защиты» в #10/2009 номере ][ ). Одним из новых элементов разметки является атрибут autofocus. Это достаточно долгожданный атрибут, потому как ранее, практически все время приходилось делать JavaScript-обработку автофокуса. И в вот в HTML5, наконец, добавили атрибут для автофокусировки на определённом текстовом поле. Но давай представим себе использование этого атрибута как способа автоматического исполнения кода:

    <input onfocus=alert(1) autofocus>
    <input onblur=write(1) autofocus><input autofocus>

    Этот приём может пригодиться, например, когда фильтруются угловые скобки. Тег <video>, который мы уже сегодня вспоминали, несет в себе помимо собственно мультимедийных функций ещё и возможности выполнения JavaScript-кода (кто бы мог подумать :) через атрибут poster:

    <video poster=javascript:alert(1)//
    <video><source onerror="javascript:alert(1)">

    К «заслугам» <video> можно отнести еще и возможность точной идентификации веб-браузера. Будет еще одним приемом в копилке Metasploit Decloak. Примеры c новысми элементами можно продолжать. Как тебе, например, самовыполнение JavaScript с помощью обработчика onscroll тега и всё того же атрибута autofocus?

    <body onscroll=alert(1)><br><br><br>...<br><input autofocus>

    Или вот еще финт, правда он работает пока только в последних версиях Оперы:

    <form id="test" /><button form="test" formaction="javascript:alert(1)">

    Новые типы полей форм


    Помимо новых тегов и атрибутов, в HTML5 большое внимание уделено взаимодействию веб-приложений с пользователем и добавлено большое количество типов текстовых полей ввода: datetime, datetime-local, date, month, time, week, number, range, email, url, search, tel, color. Они призваны добавить больше смысловой нагрузки обычным текстовым полям. Так для поля date будет возможно удобно выбрать дату, не прибегая к использованию готовых календарей на JavaScript. Не придется больше заморачиваться с текстом-заглушкой. В общем, наконец, появятся более удобные и подходящие по контексту средства ввода информации.

     <style>
                [required] {
                  background-color: green;
                }
                :invalid {
                  background-color: red;
                }
            </style>
    …
    <input name="email" type="email"/>
    

    Что важно с точки зрения безопасности, так это то, что поля будут сами себя валидировать!

    Валидация данных в формах
    Валидация данных в формах

    С одной стороны, ура — больше не надо писать регулярки по RFC (хотя и у тебя этого права никто не отнимает, благо теперь добавлен специальный атрибут pattern) и заморачиваться опять же проверками на JavaScript перед отправкой данных формы на сервер. С другой стороны не следует забывать про валидацию на стороне серверной части веб-приложения! Как ни странно, но практика показывает, что и сейчас часто встречаются случаи, когда про серверные проверки забывают или реализуют их недостаточно строго. Проверке на стороне веб-браузера, как понимаешь, доверять уж точно не стоит. Особенно «замылиться глаз» может при разработке AJAX-части современных веб-приложений. И вот чего я опасаюсь: если эта валидация ещё больше упроститься, то как бы разработчики и вовсе про нее не забыли!

    Cross-document messaging


    Веб-браузеры по причинам безопасности ограничивают взаимодействие (доступ и обмен данными) клиентских частей веб-приложений, размещенных на разных доменах. Несмотря на то, что ограничение вроде как действительно нужное с точки зрения безопасности, междокументное взаимодействие в некоторых случаях часто оказывается необходимым. Например, это может быть актуально для виджетных технологий. Система междокументных сообщений позволяет (в идеале) безопасным способом обмениваться данными документам, размещенным на разных доменах, и поддерживается уже как минимум Firefox, Google Chrome.
    Рассмотрим, как работает данный механизм. Пусть сайт (вернее его клиентская часть) example.com/index.html хочет взаимодействовать с foo.com/iframe.html, который загружен в айфрейме. В таком случае на foo.com инициализируется «получатель» сообщений. Код получателя сообщений на foo.com:

    <div id="msg">...</div><script>
    window.addEventListener('message', receiver, false);
    function receiver(e) {
        if (e.origin != 'http://example.com') {
            return;
        }
        document.getElementById('msg').innerHTML = 
        'Origin: ' + e.origin  + ' From: ' + e.source  + ' Data: ' + e.data;
    } 
    </script>

    Обрати внимание на явную проверку отправителя (e.origin). Но даже с такой проверкой надо не забывать валидировать пришедшие данные на тот случай, если на доверенном отправителе вдруг обнаружится, скажем, XSS. А в документе (клиентской части) a.example.com мы отправляем сообщение получателю:

    function postMsg() {
      var o = document.getElementById('ifra');   
      o.contentWindow.postMessage(document.getElementById('msg').value, 'http://foo.com/');
      return false;
    }
    

    Здесь важно явным образом указывать адресата сообщения targetOrigin. Даже не смотря на то, что стандартом предусмотрена возможность указать «*» и тем самым разрешить отправлять сообщения любому адресату. Имхо, основной риск в этом механизме в изначальной сложности безопасной реализации обмена сообщениями. Разработчику нужно чётко понимать, что он делает. ТВелик риск элементарно забыть про проверку отправителя. Может оказаться опасным «слепое» использование пришедших данных, что приведет к перерождению DOM-based XSS.

    Определение местоположения


    Текущие местоположение — достаточно важный аспект частной жизни («приватности»), поэтому реализовывать механизмы его определения надо с большой осторожностью. Этот аспект описан в секции «Security and privacy considerations» спецификации от W3С. Если в двух словах, то в спецификации заявлено о том, что месторасположение должно быть явным образом разрешено посетителем сайта. Технически это реализуется вызовом специального метода объекта navigator.geolocation

    if (navigator.geolocation) {
      navigator.geolocation.getCurrentPosition(function(position) {
        var lat = position.coords.latitude;
        var lng = position.coords.longitude;
        var options = {position: new google.maps.LatLng(lat, lng) }
        var marker = new google.maps.Marker(options);
        marker.setMap(map);
      });
    }
    

    Во всех популярных браузерах (за исключением MS Internet Explorer, в котором Geolocation API попросту не реализован) при заходе страницу, использующую гелокацию, отображается предупреждение о сборе сведений и спрашивается разрешение у пользователя. При этом есть возможность запомнить свой выбор и/или поместить сайт в белый либо чёрный список. Важно, что при этом учитывается домен сайта, не включая полный путь до скрипта…
    В ходе определения местоположения веб-браузер собирает данные о твоем IP-адресе, ближайших точках беспроводного доступа и возможно другую подобную информацию (например, случайный идентификатор клиента назначаемого Google, который истекает через 2 недели) и пересылает это всё сервису определения местоположения. А теперь, братья-параноики, угадайте, кто будет являться этим самым сервисом в большом количестве случаев (Google Chrome, Firefox, Opera)?! Правильно, Google Location Services! Нам, конечно обещают, что:
    «Ни Mozilla ни Google никогда не будут использовать собранную Google Location Services информацию для вашей идентификации и никогда не будут за ваши шпионить.»
    Но мы то знаем, что никому нельзя верить! :) Так же следует обратить внимание на печальные последствия, которые принесёт XSS на разрешенном для сбора координат сайте.

    В заключение


    Хочется надеяться, что наученные горьким опытом разработчики веб-приложений не только кинутся реализовывать все действительно интересные и нужные фишки HTML5, но и проштудируют разделы «Security» соответствующих спецификаций. Радаует, что не отстают от прогресса и различные инструменты для пентестеров, в том числе W3AF, являющийся мощным и свободный фреймворком для проведения аудита безопасности веб-приложений. Ваш покорный слуга является одним из участников этого проекта и мы уже добавили модули для поиска мест использования WebStorage и другие рискованные участки кода. Так что при очередном аудите сайта на безопасность ты можешь определить, используются ли там фишки HTML5 :).

    Полезные ссылки:
    Журнал Хакер, Декабрь (12) 143
    Тарас «oxdef» Иващенко
    Дмитрий «Invent» Сидоров


    Подпишись на «Хакер»
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 18

      +9
      Отличная статья. Спасибо!
        +5
        Очень хорошо. Ваш блог один из немногих правильных платных блогов. Чего, например, только стоит статья про ядро Windows. Спасибо!
          +1
          Давно пора было ввести поля ввода типа date, time, etc.

          Думаю появление мобильных устройств (читай iPhone) с их «заточенными» контролами сильно поспособтвовало.
            +3
            Про Википедию забыли. Википедия была одним из самых первых (ещё задолго до того, как Fx стал поддерживать воспроизведение в браузере) сторонников HTML5/Theora-видео и другие форматы не поддерживает.
              +2
              А зря. Теоре крынты судя по всему как минимум в вебе.
              +5
              Что то ксакеп стал хорошеть… Как оформить подписку на ваш журнал?
                +2
                +1, думал зайти постебаться над очередным «слыш, чувак, ща я тебе расскажу как похачить комп твоего чудака-соседа через новый супермегапорнотроян», залез под кат, смотрю, а тут ВНЕЗАПНО — торт! :)))
                  +1
                  Он уже давно «хорош». Говорю Вам, как постоянный читатель с самого первого номера =)
                  Просто почему-то у всех сформировался стереотип касательно этого журнала.
                    –1
                    поддерживаю.
                    постоянно читаю журнал с 2006 года. Прогресс есть!
                    +1
                    Проще и дешевле всего оформить редакционную подписку. Это онлайн-магазин общий для издательства. Он уныл и туп, но работает.
                    +3
                    Нашел в презентации интересный слайд Speech Input (24) сказал в микрофон «Яндекс» на что мне бодро заявило что я сказал «young dicks» :))
                      +2
                      А на хабрахабр мне отвечают «barbara harbor»
                      0
                      Думаю, стоит также иметь в виду FileAPI (который пока реализован частично и не везде). Очень интересный функционал, существенно расширяющий возможности JS (Аудиоплеер на JS? Легко! Архиватор? Да пожалуйста!). С другой стороны, при работе с ФС нужно быть осторожным. Хотя тут все «в песочнице», но наверняка найдутся «умельцы», которые сумеют и эти возможности использовать в своих корыстных целях.
                        +3
                        Новые технологии всегда с «дырками», ведь главное чтобы руки золотые были!
                          0
                          … но ведь и расти они могут из золотой жопы.
                          +1
                          Позвольте немного позанудствовать. Некоторые фразы, как кажется, в целях упрощения (а может просто по незнанию) написаны так, что их в итоге сложно понять, например: «К примеру, в Firefox действует лимит на .example.com». Я долго думал над этой фразой. А на других доменах не действует что ли? К чему это? Оказалось, что речь лишь про проверку только на домен второго уровня.

                          Про sql — неправильный пример показали, а правильный — нет. WebSQL из коробки поддерживает placeholders, и если говорите о безопасности, то об этом обязательно нужно говорить.
                            0
                              0
                              Действительно, отличная статья. Спасибо!

                              Если бы только все разработчики читали подобные статьи. И даже не только читали, а применяли полученные знания (и свою голову!) на практике…

                              Only users with full accounts can post comments. Log in, please.