All streams
Search
Write a publication
Pull to refresh
345
0
Илья Сегалович @iseg

User

Send message
Не путайте пожалуйста XML и Html. Я же вам ссылоку даже дал

http://www.whatwg.org/
> "Отечественным поисковикам"
Почему только отечественным? А Google? А Ask? А MSN|Live?

> "давно пора"
С какого конкретно числа?

> "взять на заметку"
Взяли.

> "что-нибудь подобное"
Что именно? Почему noindex не подобное?

> "предложенный когда-то Яндексу автором этих строк"

Почитайте
= (1) дискуссию в блоге Yahoo про этот атрибут и его критику
= (2) http://www.whatwg.org/specs/web-apps/cur…
Бывают разные ситуации. Правильно говорите. Именно. Вам осталось только признать, что спрашивать никогда не вредно, и я с вами почти полностью соглашусь.

(Печально откланивается и уходит, осмысливая оскорбление, нанесенное ему Большой Советской Энциклопедией: http://slovari.yandex.ru/art.xml?art=bse… )
Мне кажется, вы слишком категоричны. В языках бывают разные ситуации, в том числе и ситуации, когда "мнение" учитывается. Сравните голландский с французским, например:

http://en.wikipedia.org/wiki/Negro

The word has had a similar history in languages such as Italian. Neger in Dutch and German had the same meaning. In the Netherlands, where there are quite a lot of black people, neger is generally not considered a slur. In French, ne`gre was the word generally used in the 19th century and earlier times to describe black persons of African origin, or, sometimes, more specifically African slaves. However, it now considered as a racist word, and the word noir (literally, "black") is always used instead, except occasionally when specifically discussing slavery or colonialism, or when n
давайте решим.
а спрашивать их мнение будем?
Или даже не думает, но кто-то же должен это говорить.
Вы про Google Answers?
сколько еще ждать, пока разорвет?
Кстати, официально заявляю: "я люблю гугл(ь)".
ИМО, хабр - это вебдваноль. Явленный. Потому мы его и читаем.

А секретный текст на то и секретный, чтобы держать его в самом потайном месте Яндекса. Но вам по секрету скажу - он в ножке бильярдного стола.
Это повтор РОМИП-овского доклада.
зато не бывает полподписи на картинке.
1. Как же я могу в споре об определяемости, общепризнаности и общепонимаемости (и самом существовании видимо тоже) некоторого понятия (поисковый спам) ссылаться на свое собственное определение?

Оппонент же уже его прочитал (см выше), и заранее убежден в том, что мое мнение - частное, нерепрезентирующее, необщепризнанное и тд, и тп.

Именно поэтому я и собрал здесь чужие определения, чтобы подчеркнуть то общее, что есть у них всех.

2. Специфировано давно уже все, только спецификация не есть перечисление технических приемов. Специфируются "родовые черты", а не все возможные виды чего бы то ни было. Например, родовой чертой спама является его предназначение.

Отнюдь. Вовсе не любой сайт.

Читаем:

http://help.yahoo.com/help/us/ysearch/de…

Search engine spam refers to pages that are considered unwanted and appear in search results with the intent to deceive or attract clicks, with little regard for relevance or overall quality of the user experience.

Some, but not all, examples include:

* Pages that harm accuracy, diversity, or relevance of search results
* Pages that seem deceptive, fraudulent, or provide a poor user experience
* Pages dedicated to redirecting the user to another page
* Pages in great quantity, automatically generated or of little value
* Pages using methods to artificially inflate search engine ranking
* The use of text that is hidden from the user
* Excessively cross-linking sites to inflate a site's apparent popularity
* Pages built primarily for search engines
* Misuse of competitor names/products

Или здесь:

http://www.google.com/support/webmasters…
Quality guidelines

These quality guidelines cover the most common forms of deceptive or manipulative behavior, but Google may respond negatively to other misleading practices not listed here (e.g. tricking users by registering misspellings of well-known websites). It's not safe to assume that just because a specific deceptive technique isn't included on this page, Google approves of it. Webmasters who spend their energies upholding the spirit of the basic principles will provide a much better user experience and subsequently enjoy better ranking than those who spend their time looking for loopholes they can exploit.

If you believe that another site is abusing Google's quality guidelines, please report that site at http://www. google.com/contact/spamreport.html. Google prefers developing scalable and automated solutions to problems, so we attempt to minimize hand-to-hand spam fighting. The spam reports we receive are used to create scalable algorithms that recognize and block future spam attempts.

Quality guidelines - basic principles

* Make pages for users, not for search engines. Don't deceive your users or present different content to search engines than you display to users, which is commonly referred to as "cloaking."
* Avoid tricks intended to improve search engine rankings. A good rule of thumb is whether you'd feel comfortable explaining what you've done to a website that competes with you. Another useful test is to ask, "Does this help my users? Would I do this if search engines didn't exist?"
* Don't participate in link schemes designed to increase your site's ranking or PageRank. In particular, avoid links to web spammers or "bad neighborhoods" on the web, as your own ranking may be affected adversely by those links.
* Don't use unauthorized computer programs to submit pages, check rankings, etc. Such programs consume computing resources and violate our Terms of Service. Google does not recommend the use of products such as WebPosition Gold™ that send automatic or programmatic queries to Google.

Quality guidelines - specific guidelines

* Avoid hidden text or hidden links.
* Don't employ cloaking or sneaky redirects.
* Don't send automated queries to Google.
* Don't load pages with irrelevant words.
* Don't create multiple pages, subdomains, or domains with substantially duplicate content.
* Don't create pages that install viruses, trojans, or other badware.
* Avoid "doorway" pages created just for search engines, or other "cookie cutter" approaches such as affiliate programs with little or no original content.
* If your site participates in an affiliate program, make sure that your site adds value. Provide unique and relevant content that gives users a reason to visit your site first


Насчет этической проблемы - вам видимо виднее.

Полвеба завалено непонятно чем, десять тысяч человек во всем мире (минимум) сидят и занимаются чем-то типа копированием чужого контента без спроса и иным порождением разного "джанка", а проблемы конечно нет никакой. Ни этической, ни общественной.
из того что в природе не существует исчерпывающего списка способов убийства челвоека статью соответствующего УК никто не отмяняет, правда?

может быть определение поянтия не всегда требует исчерпания его таксономии?

подумайте об этом.
сейсмограммы и результаты их обработки.
может быть это религиозное ощущение?
по единственному наблюдаемомоу вами запросу?
> Гугл единственный, кто реально очень неплохо клеит
> нечеткие дубли. Яндексовский веб-поиск этого не делает вообще

ой? а как вы это поняли?

Мы иногда чего-то на эту тему публикуем

Вот например http://www2002.org/CDROM/poster/187/

Или вот здесь: http://www.rcdl2006.uniyar.ac.ru/ru/doc/…

Там будет написано, что показатели у G = 88.4% "уникальных" в "чистой" выдаче (то есть без &filter=0) и у Y = 90.1% "уникальных" в "чистой" выдаче (то есть без &rd=0).

Показатели близкие, но существенно более объективные чем если судить по одном запросу.

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Works in
Date of birth
Registered