BBSoD May 3 2007 at 21:35

Yahoo вводит синтаксис nocontent для CSS

1 min

Search engines*

+12

Comments 43

Ruberoid May 3 2007 at 21:39

Почему? Вполне вероятно опыт переймут и остальные. Я, например, без никуда. Почему бы не сделать CSS-овца брата?

Ruberoid May 3 2007 at 21:40

без noindex... Скобки не пропечатываются.. зараза :)
А если так попробовать <noindex> ?

-1

Ruberoid May 3 2007 at 21:41

Ура! < и > работает!

Ruberoid May 3 2007 at 21:42

а это я написал с помощью &amp! :)

BBSoD May 3 2007 at 21:43

Три ответа на собственный комментарий — абсолютный рекорд! :)

Ruberoid May 3 2007 at 21:49

Вечер. Пиво. Хабр. Жена. Дом-2. Вот оно счастье!

ProRunner May 4 2007 at 01:00

Не уверен. Три и у меня бывало :)

ProRunner May 4 2007 at 01:00

Хотя нет — два.

ProRunner May 4 2007 at 01:01

А не побить ли нам рекорд... :)

fanex May 4 2007 at 12:02

Уже не получится :)

BoG May 3 2007 at 22:14

Маловероятно что это начинание получит большое распространение, но оптимизаторы уже обсуждают варианты использования технологии для своих целей.

MTonly May 4 2007 at 02:27

Отечественным поисковикам давно пора взять на заметку что-нибудь подобное. В отличие от выдуманного HTML-элемента noindex (<index></index> Бегуна — туда же), способ «валидный», т. е. не портит соответствующую веб-стандартам страницу, как и предложенный когда-то Яндексу автором этих строк [успешно проигнорированный — по меньшей мере, формально] эквивалент noindex на основе HTML-комментариев:
.

P. S. Думаю, имеет смысл добавить метку «микроформаты». ;-)

iseg May 7 2007 at 13:30

> "Отечественным поисковикам"
Почему только отечественным? А Google? А Ask? А MSN|Live?

> "давно пора"
С какого конкретно числа?

> "взять на заметку"
Взяли.

> "что-нибудь подобное"
Что именно? Почему noindex не подобное?

> "предложенный когда-то Яндексу автором этих строк"

Почитайте
= (1) дискуссию в блоге Yahoo про этот атрибут и его критику
= (2) http://www.whatwg.org/specs/web-apps/cur…

MTonly May 7 2007 at 14:37

> "давно пора"
С какого конкретно числа?

С тех пор, как в рунете появились люди, для кого соответствие веб-стандартам имеет значение.

> "взять на заметку"
Взяли.

Рад.

>"что-нибудь подобное"
Что именно? Почему noindex не подобное?

noindex, как уже сказано, не соответствует веб-стандартам и потому применительно к сайтам, для владельцев которых соответствие стандартам принципиально, совершенно бесполезен. Служебный класс, предложенный Yahoo!, как и noindex на основе HTML-комментариев, предложенный пару-тройку лет назад вашим покорным слугой, лишён этого недостатка, не более и не менее того.

iseg May 7 2007 at 14:53

Не путайте пожалуйста XML и Html. Я же вам ссылоку даже дал

http://www.whatwg.org/

MTonly May 7 2007 at 15:15

Я в курсе, где находятся и какие именно спецификации, и ничего не путаю.

iseg May 7 2007 at 15:19

Тогда зачем вы пишете о XML-валидаторах, которые "ругаются" на NOINDEX?

Они ведь должны ругаться еще на десяток отлично понимаемых всеми браузерами тегов, не так ли?

MTonly May 7 2007 at 15:33

Валидатор проверяет HTML4-документ на соответствие стандарту HTML4, XMTML-документ — стандарту XHTML. noindex ни в один из них не входит.

MTonly May 7 2007 at 15:26

И, к слову, спеки HTML 4 / XHTML 1 находятся совсем в другом месте. Труды WHATWG относятся к будущему HTML5, использование их в качестве источника текущих спецификаций некорректно.

iseg May 7 2007 at 15:03

Таким должно быть поведение всех СООТВЕТСТВУЮЩИХ HTML-стандарту агентов при обработке тега NOINDEX

> A start tag token not covered by the previous entries
> Reconstruct the active formatting elements, if any.
> Insert an HTML element for the token.
> This element will be a phrasing element.

Возражения?

MTonly May 7 2007 at 15:19

Существование алгоритма поведения агента при встрече с неизвестным элементом не делает документ, содержащий такие элементы, соответствующим стандарту с чётко определённым набором допустимых элементов. Валидатор вам в помощь. ;-)

iseg May 7 2007 at 15:34

То, о чем вы пищете (HTML, которые соответствует стандарту XML), в некотором смусле "не существует" в природе

= 90% HTML ему не соответствуют
= все браузеры рисуют и исполняют не его, а совсем другой язык разметки

Зафиксировать и _стандартизовать_ реальное положение дел с HTML призван whatwg

MTonly May 7 2007 at 15:39

Про 90% не сомневаюсь. Только стандарт от этого не перестаёт быть стандартом. И для тех, кому соответствие стандарту принципиально, noindex в виде HTML-элемента бесполезен. Впрочем, мы, кажется, начинаем входить в цикл.
Будет возможность, Зельдмана почитайте на досуге. ;-)

iseg May 7 2007 at 16:10

Читать я люблю: что именно у Зельдмана?

MTonly May 7 2007 at 16:46

Zeldman: Designing With Web Standards (оф. сайт)
Web-дизайн по стандартам (Ozon)

MTonly May 7 2007 at 14:41

> "Отечественным поисковикам"
Почему только отечественным? А Google? А Ask? А MSN|Live?

Для русскоговорящего пользователя основное значение имеют русскоязычные поисковики. Подобные шаги со стороны Google и проч., разумеется, тоже имеют значение.

iseg May 7 2007 at 14:54

Подозреваю, что решение помечать элементы неудобно и не будет ими поддержано.
Хотя посмотрим конечно.

MTonly May 7 2007 at 15:35

Не более неудобно, чем не соответствующий стандарту элемент noindex.

iseg May 7 2007 at 15:39

Конечно оно более неудобно. Почитайте же наконец дискуссию в блоге Yahoo!

Насчет соответствия стандарту XML и SGML: "РЕАЛЬНЫЙ HTML" им не соответствовал, не соответствует и не будет соответствовать никогда.

Именно поэтому, то, что делает Мозилла в whatwg - честно. А то, чем сейчас занимается Микрософт в W3C - неприлично и есть обман дурачков.

MTonly May 7 2007 at 15:43

iseg May 8 2007 at 13:42

http://webstandardsgroup.org/features/la…

HTML 5 is ... an effort to document and standardise many of the features of HTML and the DOM that authors use all the time, but which were poorly defined in HTML4 or previously undocumented

... it’s extremely unlikely that we will ever see XHTML2 implementations in mainstream web browsers ...

... in my view, XHTML2 is unnecessary ...

Иными словами та же мысль.

netklon May 4 2007 at 10:02

То есть Yahoo сам признается, что отличить важный контент от второстепенного его софт уже не в состоянии?

Beholder May 4 2007 at 10:12

Поскольку искусственный интеллект ещё не изобрели.

kizu May 4 2007 at 10:40

Мне кажется, что CSS особого отношения к делу, все же, не имеет :)
class, как таковой, конечно, имеет отношение к CSS, но в данном-то случае он не для каскадной таблицы стилей используется, а для роботов.
Так что в этой заметке можно отовсюду выкинуть CSS и станет только лучше :)

-1

rossomachin May 4 2007 at 11:50

А вот и нет. Самая важная часть технологии — именно использование CSS. Widely adopted и всё такое.

kizu May 4 2007 at 12:06

И где же он там используется? %)
В тексте по ссылке про это ничего нет.
Там есть строчка "which will indicate to our crawler what parts of a page are unrelated to the main content and are only useful for visitors" и я не думаю, что crawler имеет дело с CSS при индексировании )

Как уже в комментариях сказали - это микроформат и, скажем, заголовок заметки лучше бы выглядел, например, таким: "Yahoo вводит микроформат nocontent для ограничения индексации данных" или что-то вроде того.

rossomachin May 4 2007 at 13:45

Да, формально вы правы.

kizu May 4 2007 at 13:48

А неформально?
Просто мне интересно, вдруг я что-то упускаю.

rossomachin May 4 2007 at 16:28

Ну просто когда речь заходит о микроформатах, обычно напирают на то, что для их использования достаточно инструментария, отлично внедрённого в CSS (хотя на самом деле это атрибуты элементов из спецификации (X)HTML). Понятно, что формально все эти штуки и в JavaScript-конструкция могут быть использованы в том же самом качестве якорей, за которые выдёргивают нужный элемент.

Вероятно, людям так понятней, как это работает. Как бы сразу ясно, что это не какие-то новые элементы или атрибуты языка разметки.

kizu May 4 2007 at 16:41

Ну, с одной стороны согласен, что понятней - я когда первый раз встретил термин "микроформат" тоже думал, что это что-то страшное %)
С другой - вот скажем, в тегах к этой заметке стоит "CSS", при этом человек, который будет искать что-либо связанное с CSS - ему эта заметка ну очень вряд ли будет нужна )
Т.е. все упирается в правильную формулировку заголовка - нужно чтобы людям понятно было, но ведь и смысл не должен меняться.
А тут: речь идет о структуре контента, тогда как CSS, вроде как, в первую очередь ассоциируется с оформлением.

gorinich May 4 2007 at 11:02

В конце концов микроформаты спасут мир поисковых машин. Осталось только внедрить их повсеместно )))
Я в своем проекте решил использовать микроформаты. Пробовал даже приложения под FireFox, которые их видят. Самое классное, WebCards, оказалось самым глючным :(
Но все равно, микроформаты НАДО использовать. Они не только помогут поисковым машинам в их нелегком деле, но еще и просто самому приятно :)

rossomachin May 4 2007 at 16:30

Микроформаты не смогут решить полный спектр семантических задач.

gorinich May 4 2007 at 16:38

Согласен, не смогут. Но по крайней мере облегчат решение этих задач в разы.
К тому же на данный момент существует весьма ограниченный набор микроформатов. А в будущем, кто знает, может и решат ;)

Show the best of all time