Pull to refresh

Comments 47

Эх, нам бы не количеством, нам бы качеством прирастать.
Существенная часть этого прироста - домены, купленные для спама поисковых машин. Соотношение между монетизацией поискового трафика и стоимостью домена достигло критической точки. Такая же история в доменах .com, .info и многих других. Тут не радоваться надо, а в набат бить.
Кому бить в набат и для кого? Поисковикам требуется помощь "всем миром"?
Я думал, что от спама, кроме поисковиков, страдают и все остальные тоже.

Вебмастера - потому что любой блог/форум заспамливают.
Пользователи поисковиков - потому что попадают на дорвеи.

Ну да, наверное, только хостерам выгоден этот процесс.
Выгоден только регистраторам доменов. Хостерам такое нафиг не нужно. Ну разве что тем, кто специализируется на дорвейщиках и т.п.

Страдают все, но что-то конкретное могут делать только поисковики и не понятно, чем здесь могут помочь все остальные. Я и спрашиваю, чем?
Ну хотя бы тем, чтобы не радоваться росту на 4% в месяц =)
Поисковики, кстати, достаточно вежливо, но пассивно реагируют на инициативы со стороны хостеров. Мне показалось, что если поисковик и не поддерживает поисковый спам, то и стремления всеми способами его побороть нет тоже.
А напиши мне (сюда или почтой kukutz@yandex-team.ru) какую ты имеешь в виду инициативу, плз.
Окстись! Это бич Божий для нас. Самая страшная вещь - это смотреть утреннии отчёты от системы учёта ресурсов. Половина нагрузки идёт с "жадности" клиента получить заходы поисковика. Почитай меня. Не было месяца последние полгода, чтобы я не прошёлся по этой теме :)
В этой задаче (чистка спама) не бывает 100% точности и полноты. Спамеры как раз живут на том самом "одном проценте". И всегда будут жить.

При цене домена стремящемся к нулю, радоваться тому, что за отчетный период среди моря нежити будет регистрироваться исчезающе малое количество нормальных доменов, могут только глубоко ослепшие люди.

Если "помощь всем миром" - это осознание спама как общественного зла, то да, конечно неплохо было бы такую помощь почувствовать.

Конечно есть люди, особенно занятые в этом бизнесе, которые будут активно защищать спам, это очевидно, вот и ваши комментарии, например, тоже об этом свидетельствуют.

Мда, от последнего абзаца я даже сначала онемел. Вы оперируете словами как заправский политик или демагог и умудрились без всякого на то основания меня обвинить и оскорбить. Тем не менее оставив без ответа _основную_ тему, т.е. то, как вы видите помощь всем миром.

Может быть вы все-таки скажете? Только конкретнее, без абстракций о добре и зле - те, кто пересекается с этим и так вполне понимают, что спам это зло; а оленеводам не стоит этим забивать голову.

Т.е. три вопроса:
Чем я, как обычный человек, могу помочь яндексу?
Почему я, а не нанятые яндексом сотрудники?
Чем может помочь необычный человек или организация?
Я нигде и ни в какой форме не просил вас *лично* о помощи. Если я правильно понимаю дискуссию, то в сущности я утверждал, что поисковый спам - серьезная этическая и общественная проблема, а вы утверждали, что это проблема только и исключительно поисковиков. Позиция знакомая и понятная. Опять же, людей занятых созданием дорвеев в Рунете несколько сотен, как минимум. Если я ошибся с вашей идентификацией - извините.
Я понял фразу про набат буквально - что требуется помощь от всех. И мое утверждение про поисковики касалось только того, что я не вижу, как кто-то кроме поисковиков может принимать какие-то конкретные меры. С моей идентификацией ошиблись.
Формулировки с народ.ру для коммерческих хостеров точно не подойдут. Не смотря на то, что это еще и нарушение закона о связи и неправомерный отказ в оказании услуг.

Не говоря о том, что это очень нечеткая формулировка. Вот, например, платные ссылки на exler.ru - это разрешенная специальным образом реклама или нет? Кто ее должен разрешать? Как вычислять степень ее разрешенности? Какой-нибудь госорган типа МАП?

А баннерная реклама на сайте является разрешенной? Ведь я как посетитель сайта ее явным образом видеть не желаю. А она есть. Да еще и ссылку на кого-то имеет.

Сайты с похожим контентом - кто будет компетентным лицом, определяющим дорвей это или нет?

Пожалуйста, не принимайте мои слова как защиту поисковых спаммеров, в ведь видете что в них этого нет. Ведь это просто малый список слабых мест, который можно еще продолжить, и которые не понятно как и кто должен закрывать. Но если содержать еще один госорган - я сразу против.
по анаологии: нужна ли компетентность для определения почтовго спама? на каком основании провайдеры закрывают почтово-спаммерские аккаунты? и тд.

я не вижу здесь серьезных проблем с точки зрения законодательства. правила оказания услуг вполне могут подразумевать соблюдение тех или иных условий. например бесплатный хостинг может запрещать баннерную рекламу и тп.
С бесплатными понятно, они могут в полиси внести и закрытие по пятницам. Платные ограничены законом.

Но по поводу компетенции - моей явно не хватит, чтобы решить зайдя на чей-то сайт - "нормальный" он, или клон для увеличения рейтинга.

С экслеровскими ссылками так и не понятно. Или это менее существенная проблема?
в любой задаче классификации есть "серая" зона, но она не отменяет самой задачи.
Дорвеи класса "нежить" органолептически определяются достаточно просто, по многим признакам. Наметанному глазу достаточно одного взгляда.

А что такое "Экслеровские ссылки"?
Но есть ли хотя бы для несерых формальное и однозначное описание, которое бы позволило суду, если понадобится, удостовериться в нарушении закона? Или это должны быть эксперты по аналогии с определеием нарушений закона о рекламе?

Экслеровские ссыли - ссылки для повышения поискового рейтинга, размещаемые за плату на сайтах, имеющих высокий индекс цитирования. Может быть есть более каноническое название, не знаю.
Да. вот мне тоже интересно услышать ответы на вопросы sply. Вот я, например, готов оказать любое посильное содействия. Но какое содействие нужно именно вам?
У меня есть четвёртый вопрос:
Почему это выясняется только в кулуарах? :)
Есть много способов совместной чистки сети.

В качестве примера: Народ.Ру, кажется, единственный хостинг Рунета, в ПС которого (с самого основания) прописан пункт про запрет поискового спама. В текущей формулировке это звучит так: {загрузки, посылки, передачи или любого другого способа размещения не разрешенной специальным образом рекламной информации, спама (в том числе и поискового)}.

Наскольок я понимаю, поисковый спам на остальный хостингах официально разрешен. Не делается ничего для противодействия ему, не отрабатываются жалобы, не удаляются сайты, не фиксируются систематические нарушители и тд.

Возможно потому что эта проблема считалась несущественой.
Ну так давайте, будем делать ;) Не было никаких ни от кого жалоб. Видел только жалобы на расылку спама в форумы. Давайте встречаться, вырабатывать стратегии, писать документы. Я, например, такие вещи самостоятельно не трогаю только потому, что я думал, что не получу поддержки. А вот тут в кулуарах выясняется что нет - получу :) Давайте выведем это из кулуаров в массы.
имхо я бы на месте фрихостеров особо и не прописывал запреты.
просто удалял бы тихо доры и весь 404 трафик обрабатывал сам.
при больших объемах - трафа море :)
ну а сконвертить его можно вполне
Илья, а как поисковый спам может быть разрешен или запрещен, если он никак не определен? Вы же читали лицензию Яндекса, п.3.5? Как кто-то, кроме Яндекса, может бороться с поисковым спамом, если никто не знает, что спам, а что нет? Ведь "Мы также не сообщаем исчерпывающий список методов спама"...
из того что в природе не существует исчерпывающего списка способов убийства челвоека статью соответствующего УК никто не отмяняет, правда?

может быть определение поянтия не всегда требует исчерпания его таксономии?

подумайте об этом.
"Что считать спамом" - это отнюдь не риторический вопрос. Поскольку на данный момент под определение спама попадает практически любой сайт. И де факто спамом может оказаться любой ресурс, который модератор поисковика сочтет спамом. Безо всякой таксономии.

Кроме того, сложно согласиться, что поисковый спам, как он определен на данный момент, т.е. "попытки обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска" - это "этическая и общественная проблема".
Отнюдь. Вовсе не любой сайт.

Читаем:

http://help.yahoo.com/help/us/ysearch/de…

Search engine spam refers to pages that are considered unwanted and appear in search results with the intent to deceive or attract clicks, with little regard for relevance or overall quality of the user experience.

Some, but not all, examples include:

* Pages that harm accuracy, diversity, or relevance of search results
* Pages that seem deceptive, fraudulent, or provide a poor user experience
* Pages dedicated to redirecting the user to another page
* Pages in great quantity, automatically generated or of little value
* Pages using methods to artificially inflate search engine ranking
* The use of text that is hidden from the user
* Excessively cross-linking sites to inflate a site's apparent popularity
* Pages built primarily for search engines
* Misuse of competitor names/products

Или здесь:

http://www.google.com/support/webmasters…
Quality guidelines

These quality guidelines cover the most common forms of deceptive or manipulative behavior, but Google may respond negatively to other misleading practices not listed here (e.g. tricking users by registering misspellings of well-known websites). It's not safe to assume that just because a specific deceptive technique isn't included on this page, Google approves of it. Webmasters who spend their energies upholding the spirit of the basic principles will provide a much better user experience and subsequently enjoy better ranking than those who spend their time looking for loopholes they can exploit.

If you believe that another site is abusing Google's quality guidelines, please report that site at http://www. google.com/contact/spamreport.html. Google prefers developing scalable and automated solutions to problems, so we attempt to minimize hand-to-hand spam fighting. The spam reports we receive are used to create scalable algorithms that recognize and block future spam attempts.

Quality guidelines - basic principles

* Make pages for users, not for search engines. Don't deceive your users or present different content to search engines than you display to users, which is commonly referred to as "cloaking."
* Avoid tricks intended to improve search engine rankings. A good rule of thumb is whether you'd feel comfortable explaining what you've done to a website that competes with you. Another useful test is to ask, "Does this help my users? Would I do this if search engines didn't exist?"
* Don't participate in link schemes designed to increase your site's ranking or PageRank. In particular, avoid links to web spammers or "bad neighborhoods" on the web, as your own ranking may be affected adversely by those links.
* Don't use unauthorized computer programs to submit pages, check rankings, etc. Such programs consume computing resources and violate our Terms of Service. Google does not recommend the use of products such as WebPosition Gold™ that send automatic or programmatic queries to Google.

Quality guidelines - specific guidelines

* Avoid hidden text or hidden links.
* Don't employ cloaking or sneaky redirects.
* Don't send automated queries to Google.
* Don't load pages with irrelevant words.
* Don't create multiple pages, subdomains, or domains with substantially duplicate content.
* Don't create pages that install viruses, trojans, or other badware.
* Avoid "doorway" pages created just for search engines, or other "cookie cutter" approaches such as affiliate programs with little or no original content.
* If your site participates in an affiliate program, make sure that your site adds value. Provide unique and relevant content that gives users a reason to visit your site first


Насчет этической проблемы - вам видимо виднее.

Полвеба завалено непонятно чем, десять тысяч человек во всем мире (минимум) сидят и занимаются чем-то типа копированием чужого контента без спроса и иным порождением разного "джанка", а проблемы конечно нет никакой. Ни этической, ни общественной.
Илья,

при всем уважении - то что Яндекс не может показать кусок текста из
своих правил/лицензии, а ссылается на два других поисковика (с разной
интерпретацией спама) - не украшает.

Понятно, что специфицировать не хочется, потому как если что-то в спецификации
пропустить, то тех кто данную спецификацию хакнет придется обижать специально.

Но текущая лицензия тоже не может считаться удоволетворительной. Ведь даже
просто регистрация сайта через AddURL нацелена на появление сайта в выдаче
по каким-то запросам т.е. является попыткой манипулирования выдачей.
1. Как же я могу в споре об определяемости, общепризнаности и общепонимаемости (и самом существовании видимо тоже) некоторого понятия (поисковый спам) ссылаться на свое собственное определение?

Оппонент же уже его прочитал (см выше), и заранее убежден в том, что мое мнение - частное, нерепрезентирующее, необщепризнанное и тд, и тп.

Именно поэтому я и собрал здесь чужие определения, чтобы подчеркнуть то общее, что есть у них всех.

2. Специфировано давно уже все, только спецификация не есть перечисление технических приемов. Специфируются "родовые черты", а не все возможные виды чего бы то ни было. Например, родовой чертой спама является его предназначение.

UFO just landed and posted this here
Взаимодействуют ли поисковики друг с другом по вопросам борьбы с поисковым спамом?
Например, обмен методами выявления поискового спама, обмен базами известных спамеров?
Илья, а вы публикуйте статистику прироста сайтов - может быть не все так плохо?
И как Вы собираетесь собрать эту статистику?
я попросил об этом Илью Сегаловича
А он как соберёт эту статистику? Как она качественно будет отличаться от доменов? Да, много дорвеев отсекается, но далеко не все. Практически мы получим цифру, которая ни о чём не говорит.
в Гугле сейчас, например, дорвеи на свежезареганных доменах делать бессмысленно. Они даже себя не окупают.
В Яндексе, насколько я понимаю, уже тоже ситуация близка к этому.
В данный момент осознание этих фактов никак не поможет собрать адекватную статистику. Только мне, без специального поиска и слежки, извествен десяток дорвеев, которые на ура съедаются Яндексом (это не выпад в сторону Яндекса, просто факт). Соотвественно, если я поищу, то они будут исчисляться боюсь что сотнями.
это понятно. потому что генерятся сотнями тысяч.
еще год назад яндекс индексил/выкладывал в серп в СОТНИ раз большее число страниц :)
а статистику, думаю, яндекс не выложит. да и смысла в ней в принципе будет не то чтобы много.
бан бы тебе за повторяющиеся объявления рекламного характера
Sign up to leave a comment.

Articles