Что нового в HTML 5.0? Часть 3: Структура документа. Заключение.

Автор оригинала: Lachlan Hunt
  • Перевод
В отличие от предыдущих версий HTML и XHTML, которые определяются браузерами их синтаксисом, HTML 5 определяется в зависимости от Document Object Model (DOM) — структура («дерево») документа считываемое браузером для отображения страницы. Например, рассмотрим очень простой документ, состоящий из заголовка, подзаголовка и некоторого текста. Структура DOM будет выглядеть так:

К иллюстрации: структура документа DOM состоит из элемента «title» в заголовка «h1» и «p» элементов в теле документа.


Преимущества такого определения HTML 5 по правилам DOM в том, что сам язык может определяться независимо от синтаксиса. Есть прежде всего два синтаксиса, которые могут быть использованы для представления HTML документов: серия HTML (HTML 5) и серия XML (XHTML 5).

Серия HTML относиться к синтаксису который исходит от SGML ранних версий HTML, но определяется для совместимости с браузерами, фактически, на практике как HTML.
<!DOCTYPE html>
An HTML Document

Example


This is an example HTML document.




Отметим, что в предыдущих версиях HTML некоторые теги необязательны и добавляются автоматически.

Серия XML относится к синтаксису используемому в XML 1.0, ровно как и XHTML 1.0.
An HTML Document

Example


This is an example HTML document.



Если не учитывать различия в пробелах, а также присутствие атрибута xmlns, эти два примера эквивалентны.

Браузеры используют типы MIME чтобы различать эти документы. Любой документ, представленный как "text/html" должен соответствовать требованиям, предъявляемым к серии HTML, и любой документ с XML MIME типом как application/xhtml+xml должен соответствовать требованиям, предъявляемым к серии XML.

Разработчики должны осознанно выбирать ту или иную серию, что влияет на множество факторов. Не следует останавливаться на постоянном выборе какого-то одного типа, т.к. каждый из них оптимизирован под различные ситуации.

Преимущества использования HTML
1. Обратно совместимы с существующими браузерами.
2. Разработчики уже знакомы с синтаксисом.
3. Используемый синтаксис означает, что пользователь не сталкнется с "Желтым экраном смерти", если ошибка все-таки случайно выскользнула.
4. Удобный сокращенный синтаксис, например, разработчики могут пропустить несколько тегов и атрибутов.


Преимущества использования XHTML
1. Строгий синтаксис XML заставляет разработчиков писать хорошо размеченный код, в котором смогут разобраться и другие разработчики.
2. Интегрируется непосредственно с другими XML словари, такими как SVG и MathML
3. Позволяет использовать XML Processing, который некоторые авторы используют как часть процесса редактирования и / или размещения.


Хотите помочь разработчикам HTML 5 ?

Работа по 5 HTML продолжается, и будет продолжаться в течение нескольких лет. Тестирования, требование добиться максимальной совместимости с разными браузерами, различные оценочные работы — все это может занять около 15 лет. В ходе этих разработок, общение с широким кругом людей, в том числе, веб-дизайнерами и разработчиками, поставщиками и продавцами браузеров имеет жизненно важное значение для обеспечения его успеха релиза этих разработок.

В дополнение к спецификации, существует ряд других связанных с этим работ, чтобы помочь людям лучше понять процесс разработки.

1. Отличия от HTML 4 описывают изменения, которые коснулись прошлых версих HTML.
2. Принципы HTML дизайна описывают основные правила, которые помогут принять решения и понять многие существующие принципы разработок.
3. Руководство веб-разработчика HTML 5, было начато только недавно. Его задача — помочь веб-дизайнерам и разработчикам лучше разобраться в нововведениях HTML 5, передать опыт лучших разработчиков


Есть множество способов, с помощью которых вы можете внести свой вклад в развитие HTML 5. Вы можете присоединиться к W3C’s HTML WG или подписаться на рассылку HTML WG или WIKI. Вы также можете подписаться на какую-либо из рассылок WHATWG, общаться на форуме WHATWG, добавить комментарий или написать статьи в блог WHATWG.

Благодарю за внимание.

Средняя зарплата в IT

111 111 ₽/мес.
Средняя зарплата по всем IT-специализациям на основании 6 788 анкет, за 2-ое пол. 2020 года Узнать свою зарплату
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 18

    0
    >>все это может занять около 15 лет
    Смешно пошутили. За это время опять или МС или кто-то другой более проворный создаст свой стандарт и светит нам через 15 лет опять та же ситуация, что и сейчас.
    • НЛО прилетело и опубликовало эту надпись здесь
        0
        > Да и в MS, похоже, наконец озаботились существующими стандартами
        Будем реалистичными - устарелыми стандартами. ACID2 уже почти 3 года. Зато уже 4 дня как есть ACID3 :)
        • НЛО прилетело и опубликовало эту надпись здесь
        0
        Это оно и есть :)
        http://www.w3.org/html/wg/ внизу справа :)


        Dan Connolly, HTML Working Group co-chair
        Chris Wilson, Microsoft, co-chair
        Michael(tm) Smith, HTML roustabout
        $Revision: 1.126 $ of $Date: 2007/12/21 15:10:18 $
        +2
        Честно говоря, ничего хорошего в html-ном варианте разметки не вижу.

        Позвольте кинуть пару какашек в адрес "преимуществ" HTML-style:

        > 1. Обратно совместимы с существующими браузерами.
        Думаю, современные браузеры сейчас есть у большинства людей. У кого-то - через Windows Update, у кого-то - через emerge или apt-get, кто-то получает свежие версии сразу с установкой системы.
        А то ведь можно бояться вставлять картинки в страницы - ведь их lynx не отобразит! Тем более, раз уж все так кричат про Web 2.0...

        > 2. Разработчики уже знакомы с синтаксисом.
        Думаю, профессиональному разработчику все равно, как писать. А новичку - как раз проще закрывать все теги в соответствие с xml-стандартом, чем запоминать, какие можно не закрывать.
        Тем более, что большинство server-side фреймворков давно представляют страницу в виде объектов, а не в виде html-кода, так что разработчику даже думать не нужно о каких-то там тегах.

        > 3. Используемый синтаксис означает, что пользователь не сталкнется с "Желтым экраном смерти", если ошибка все-таки случайно выскользнула.
        Он также означает, что с подобием экрана смерти столкнется тот, кто будет использовать данные со страницы. В случае XML достаточно использовать стандартный парсер и простые XPath-выборки для получения необходимых данных со страницы. В случае HTML придется писать свой парсер или использовать библиотеки типа nTidy, чтобы получить все тот же XML.

        > 4. Удобный сокращенный синтаксис, например, разработчики могут пропустить несколько тегов и атрибутов.
        Таким образом, облегчая жизнь верстальщикам-недоучкам, мы автоматически создаем потенциальные проблемы всем, кто мог бы использовать наш контент. Давайте еще в RSS теги не закрывать, чтобы бедному Васе Пупкину со Страницей на народ.ру было проще жить ;)
          0
          Можешь отписать это в блог w3c :) Сылки все в конце статьи
            0
            Думаю, профессиональному разработчику все равно, как писать. А новичку - как раз проще закрывать все теги в соответствие с xml-стандартом, чем запоминать, какие можно не закрывать.

            w3c тоже так думало, когда xhtml продвигало, однако, как показала суровая реальность, всё не так здорово.

            большинство server-side фреймворков давно представляют страницу в виде объектов, а не в виде html-кода,

            Не один вменяемый фреймворк никогда не должен изображать из себя верстальщика.
            То что вы говорите, относится скорее к CMS вида "сваганьте свой сайт за 5 минут".
              0
              Суровая реальность - она на то и суровая реальность, что хочется как лучше, а получается как всегда :)

              А когда я говорил про server-side фреймворки, то подразумевал скорее всякие ASP.NET, J2EE и им подобные.
              +1
              1. Давайте посмотрим как быстро уходит IE6.
              http://www.liveinternet.ru/stat/ru/brows…

              2. Мне тоже кажется, что это слабый аргумент. Хотя стоит учесть, что совместимый синтаксис значительно упростит модернизацию существующих ресурсов.

              3. "Желтый экран смерти" серьезная проблема. Вот возьму сейчас в коммент вставлю незакрытый тег или пересекающиеся или с неверным атрибутом и т.д. (проверил, проходят) и все страница сдохла, т.е. потребуются очень серьезные проверки на корректность любого кода попадающего на страницу, тот самый парсер которого вы так хотите избежать. Не стоит также забывать, что на сайтах есть контент который не зависит от его разработчика, к примеру, контекстные объявления. Как долго рекламные сервисы будут адаптироваться к новому стандарту?
              От XML выиграет только небольшой процент разработчиков, а остальные получат кучу проблем с контролем валидности кода, получаемого от пользователей и сервисов.

              4. Поддержу, незакрытые теги проблема не только для парсеров, но и для тех кто будут читать или править такой код.

              W3C очень хотело пересадить всех на XHTML на за 7 лет не достигнуто не малейшего продвижения в этом направлении, если где-то и используется XHTML то как text/html т.е. о XML речи не идет. Время требует нового стандарта, а XHTML в массы не проходит, что остается делать? вернуться к HTML. При этом XHTML не хоронят, а оставляют в том же положении, что и сейчас в виде XHTML 5, возможно его время придет.

              Подробнее о плюсах и минусах HTML5 и XHTML2
              • НЛО прилетело и опубликовало эту надпись здесь
                  0
                  не поддерживает, да речь и не об этом, это ирония.
                  Мысль следующая: браузеры обновляются медленно, даже совсем плохие.
                  • НЛО прилетело и опубликовало эту надпись здесь
                • НЛО прилетело и опубликовало эту надпись здесь
                +1
                Еще раз про "...15 лет...".
                Фраза из википедии "Язык HTML был разработан британским учёным Тимом Бернерсом-Ли приблизительно в 1991—1992 годах в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария)." Т.е. четыре версии HTML разрабатывались 15 лет, хотя на самом деле наиболее значимые:
                # HTML 3.2 — 14 января 1996;
                # HTML 4.0 — 18 декабря 1997;
                # HTML 4.01 (незначительные изменения) — 24 декабря 1999; (цитата оттуда же).
                Я непонимаю в w3c опухли все чтоли! 5 версию мусолить 15 лет! Да через 15 лет их 5я версия нафиг никому не нужна будет - она нужна сейчас. Это, конечно мое ИМХО, но такими темпами HTML к тому сроку просто отомрет как основной "язык разметки" WWW.
                Уже сейчас (ха, да уже фиг знает сколько) идут полным ходом разработки Flash и Silverlight. И похоже уже 10я версия flash наконец то научится нормально работать со шрифтами, многоколоночным текстом и таблицами. Про видео и аудио я вообще молчу, да и самая большая проблема с индексированием содержимого flash уже сейчас решается разрабами google.
                Какие 15 лет!? Какие там теги audio video и native-разметка (footer, header). Серьезные дядьки вроде сидят а занимаются не поймешь чем...
                  0
                  Эко вас зацепило :)
                  0
                  Я извиняюсь...
                  Но до конца ли разработан 4.01? Может лучше бросать свои силы на него а не на 5?

                  И еще вопрос ко всем в теме... HTML 4.01 тоже дорабатывался общественностью? а то про дороботку 5 интересная инфа..
                    0
                    Море опечаток, но в целом понравилось. Спасибо за перевод!

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое