Pull to refresh

Comments 43

Почему? Вполне вероятно опыт переймут и остальные. Я, например, без никуда. Почему бы не сделать CSS-овца брата?
без noindex... Скобки не пропечатываются.. зараза :)
А если так попробовать <noindex> ?
а это я написал с помощью &amp! :)
Три ответа на собственный комментарий — абсолютный рекорд! :)
Вечер. Пиво. Хабр. Жена. Дом-2. Вот оно счастье!
Не уверен. Три и у меня бывало :)
А не побить ли нам рекорд... :)
Уже не получится :)
Отечественным поисковикам давно пора взять на заметку что-нибудь подобное. В отличие от выдуманного HTML-элемента noindex (<index></index> Бегуна — туда же), способ «валидный», т. е. не портит соответствующую веб-стандартам страницу, как и предложенный когда-то Яндексу автором этих строк [успешно проигнорированный — по меньшей мере, формально] эквивалент noindex на основе HTML-комментариев:
<!-- noindex --><!-- /noindex -->.

P. S. Думаю, имеет смысл добавить метку «микроформаты». ;-)
> "Отечественным поисковикам"
Почему только отечественным? А Google? А Ask? А MSN|Live?

> "давно пора"
С какого конкретно числа?

> "взять на заметку"
Взяли.

> "что-нибудь подобное"
Что именно? Почему noindex не подобное?

> "предложенный когда-то Яндексу автором этих строк"

Почитайте
= (1) дискуссию в блоге Yahoo про этот атрибут и его критику
= (2) http://www.whatwg.org/specs/web-apps/cur…

> "давно пора"
С какого конкретно числа?

С тех пор, как в рунете появились люди, для кого соответствие веб-стандартам имеет значение.


> "взять на заметку"
Взяли.

Рад.


>"что-нибудь подобное"
Что именно? Почему noindex не подобное?

noindex, как уже сказано, не соответствует веб-стандартам и потому применительно к сайтам, для владельцев которых соответствие стандартам принципиально, совершенно бесполезен. Служебный класс, предложенный Yahoo!, как и noindex на основе HTML-комментариев, предложенный пару-тройку лет назад вашим покорным слугой, лишён этого недостатка, не более и не менее того.

Я в курсе, где находятся и какие именно спецификации, и ничего не путаю.
Тогда зачем вы пишете о XML-валидаторах, которые "ругаются" на NOINDEX?

Они ведь должны ругаться еще на десяток отлично понимаемых всеми браузерами тегов, не так ли?
Валидатор проверяет HTML4-документ на соответствие стандарту HTML4, XMTML-документ — стандарту XHTML. noindex ни в один из них не входит.
И, к слову, спеки HTML 4 / XHTML 1 находятся совсем в другом месте. Труды WHATWG относятся к будущему HTML5, использование их в качестве источника текущих спецификаций некорректно.
Таким должно быть поведение всех СООТВЕТСТВУЮЩИХ HTML-стандарту агентов при обработке тега NOINDEX

> A start tag token not covered by the previous entries
> Reconstruct the active formatting elements, if any.
> Insert an HTML element for the token.
> This element will be a phrasing element.

Возражения?
Существование алгоритма поведения агента при встрече с неизвестным элементом не делает документ, содержащий такие элементы, соответствующим стандарту с чётко определённым набором допустимых элементов. Валидатор вам в помощь. ;-)
То, о чем вы пищете (HTML, которые соответствует стандарту XML), в некотором смусле "не существует" в природе

= 90% HTML ему не соответствуют
= все браузеры рисуют и исполняют не его, а совсем другой язык разметки

Зафиксировать и _стандартизовать_ реальное положение дел с HTML призван whatwg
Про 90% не сомневаюсь. Только стандарт от этого не перестаёт быть стандартом. И для тех, кому соответствие стандарту принципиально, noindex в виде HTML-элемента бесполезен. Впрочем, мы, кажется, начинаем входить в цикл.
Будет возможность, Зельдмана почитайте на досуге. ;-)
Читать я люблю: что именно у Зельдмана?

> "Отечественным поисковикам"
Почему только отечественным? А Google? А Ask? А MSN|Live?

Для русскоговорящего пользователя основное значение имеют русскоязычные поисковики. Подобные шаги со стороны Google и проч., разумеется, тоже имеют значение.

Подозреваю, что решение помечать элементы неудобно и не будет ими поддержано.
Хотя посмотрим конечно.
Не более неудобно, чем не соответствующий стандарту элемент noindex.
Конечно оно более неудобно. Почитайте же наконец дискуссию в блоге Yahoo!

Насчет соответствия стандарту XML и SGML: "РЕАЛЬНЫЙ HTML" им не соответствовал, не соответствует и не будет соответствовать никогда.

Именно поэтому, то, что делает Мозилла в whatwg - честно. А то, чем сейчас занимается Микрософт в W3C - неприлично и есть обман дурачков.
http://webstandardsgroup.org/features/la…

HTML 5 is ... an effort to document and standardise many of the features of HTML and the DOM that authors use all the time, but which were poorly defined in HTML4 or previously undocumented

... it’s extremely unlikely that we will ever see XHTML2 implementations in mainstream web browsers ...

... in my view, XHTML2 is unnecessary ...

Иными словами та же мысль.
То есть Yahoo сам признается, что отличить важный контент от второстепенного его софт уже не в состоянии?
Поскольку искусственный интеллект ещё не изобрели.
Мне кажется, что CSS особого отношения к делу, все же, не имеет :)
class, как таковой, конечно, имеет отношение к CSS, но в данном-то случае он не для каскадной таблицы стилей используется, а для роботов.
Так что в этой заметке можно отовсюду выкинуть CSS и станет только лучше :)
А вот и нет. Самая важная часть технологии — именно использование CSS. Widely adopted и всё такое.
И где же он там используется? %)
В тексте по ссылке про это ничего нет.
Там есть строчка "which will indicate to our crawler what parts of a page are unrelated to the main content and are only useful for visitors" и я не думаю, что crawler имеет дело с CSS при индексировании )

Как уже в комментариях сказали - это микроформат и, скажем, заголовок заметки лучше бы выглядел, например, таким: "Yahoo вводит микроформат nocontent для ограничения индексации данных" или что-то вроде того.
А неформально?
Просто мне интересно, вдруг я что-то упускаю.
Ну просто когда речь заходит о микроформатах, обычно напирают на то, что для их использования достаточно инструментария, отлично внедрённого в CSS (хотя на самом деле это атрибуты элементов из спецификации (X)HTML). Понятно, что формально все эти штуки и в JavaScript-конструкция могут быть использованы в том же самом качестве якорей, за которые выдёргивают нужный элемент.

Вероятно, людям так понятней, как это работает. Как бы сразу ясно, что это не какие-то новые элементы или атрибуты языка разметки.
Ну, с одной стороны согласен, что понятней - я когда первый раз встретил термин "микроформат" тоже думал, что это что-то страшное %)
С другой - вот скажем, в тегах к этой заметке стоит "CSS", при этом человек, который будет искать что-либо связанное с CSS - ему эта заметка ну очень вряд ли будет нужна )
Т.е. все упирается в правильную формулировку заголовка - нужно чтобы людям понятно было, но ведь и смысл не должен меняться.
А тут: речь идет о структуре контента, тогда как CSS, вроде как, в первую очередь ассоциируется с оформлением.
В конце концов микроформаты спасут мир поисковых машин. Осталось только внедрить их повсеместно )))
Я в своем проекте решил использовать микроформаты. Пробовал даже приложения под FireFox, которые их видят. Самое классное, WebCards, оказалось самым глючным :(
Но все равно, микроформаты НАДО использовать. Они не только помогут поисковым машинам в их нелегком деле, но еще и просто самому приятно :)
Микроформаты не смогут решить полный спектр семантических задач.
Согласен, не смогут. Но по крайней мере облегчат решение этих задач в разы.
К тому же на данный момент существует весьма ограниченный набор микроформатов. А в будущем, кто знает, может и решат ;)
Sign up to leave a comment.

Articles

Change theme settings