Попытаюсь вас помирить следующим примером и историей:
Кусок fast-а, как известно, принадлежит Lycos-у и vice versa. Поэтому пару лет назад, принадлежащий Lycоs-у, и до того работавший на бвзовом движке altavista поисковик fireball.de (некогда был 2-й - 3- й в Германии) пересел на базовый поиск fast.
Но это именно только собственно индексирующая машинка - полнотекстовый индекс и все. Все ранжирование, дубли, стат.ранк, ссылки, зеркала, спам, линковвая накрутка и тп и тд - вне движка. Самописное. И оно по размеру БОЛЬШЕ движка. Движок просто позволяет (как кажется менеджерам) экономить на железе и надежности.
Недостатки такого подхода: (1) чужого монстра на самом деле труднее укротить, чем своего. (2) Все нюансы, извлекаемые при индексации недоступны (а они могут понадобиться, системы-то все живые). (3) Все нюансы нужные в ранжировании тоже недоступны (и они тоже могут понадобиться в силу все той же "живости" веба).
Нету в Фасте мирового поиска (=мирового индекса) с тех самых пор, как они продал свой веб-поиск (пол-команды, сайт allthweb и собственно поисково-роботную ферму) в увертюру почти три года назад.
Registrant: Overture Services Inc. (DOM-352367) 74 N. Pasadena Ave., 3rd Floor Pasadena CA 91103 US
А Увертюра -- это Яху. Сайт alltheweb принадлежит yahoo и поиск там стоит yahoo-вский.
в любой задаче классификации есть "серая" зона, но она не отменяет самой задачи.
Дорвеи класса "нежить" органолептически определяются достаточно просто, по многим признакам. Наметанному глазу достаточно одного взгляда.
по анаологии: нужна ли компетентность для определения почтовго спама? на каком основании провайдеры закрывают почтово-спаммерские аккаунты? и тд.
я не вижу здесь серьезных проблем с точки зрения законодательства. правила оказания услуг вполне могут подразумевать соблюдение тех или иных условий. например бесплатный хостинг может запрещать баннерную рекламу и тп.
Я нигде и ни в какой форме не просил вас *лично* о помощи. Если я правильно понимаю дискуссию, то в сущности я утверждал, что поисковый спам - серьезная этическая и общественная проблема, а вы утверждали, что это проблема только и исключительно поисковиков. Позиция знакомая и понятная. Опять же, людей занятых созданием дорвеев в Рунете несколько сотен, как минимум. Если я ошибся с вашей идентификацией - извините.
В качестве примера: Народ.Ру, кажется, единственный хостинг Рунета, в ПС которого (с самого основания) прописан пункт про запрет поискового спама. В текущей формулировке это звучит так: {загрузки, посылки, передачи или любого другого способа размещения не разрешенной специальным образом рекламной информации, спама (в том числе и поискового)}.
Наскольок я понимаю, поисковый спам на остальный хостингах официально разрешен. Не делается ничего для противодействия ему, не отрабатываются жалобы, не удаляются сайты, не фиксируются систематические нарушители и тд.
Возможно потому что эта проблема считалась несущественой.
В этой задаче (чистка спама) не бывает 100% точности и полноты. Спамеры как раз живут на том самом "одном проценте". И всегда будут жить.
При цене домена стремящемся к нулю, радоваться тому, что за отчетный период среди моря нежити будет регистрироваться исчезающе малое количество нормальных доменов, могут только глубоко ослепшие люди.
Если "помощь всем миром" - это осознание спама как общественного зла, то да, конечно неплохо было бы такую помощь почувствовать.
Конечно есть люди, особенно занятые в этом бизнесе, которые будут активно защищать спам, это очевидно, вот и ваши комментарии, например, тоже об этом свидетельствуют.
Существенная часть этого прироста - домены, купленные для спама поисковых машин. Соотношение между монетизацией поискового трафика и стоимостью домена достигло критической точки. Такая же история в доменах .com, .info и многих других. Тут не радоваться надо, а в набат бить.
Понятно что журналисты, оосбенно вне индустрии, это ни знать, ни проверять не обязаны. Но habr мог бы установить добрую традицию: проверять все. А то получается что на habr нет никакой добавочной инофрмации.
Кусок fast-а, как известно, принадлежит Lycos-у и vice versa. Поэтому пару лет назад, принадлежащий Lycоs-у, и до того работавший на бвзовом движке altavista поисковик fireball.de (некогда был 2-й - 3- й в Германии) пересел на базовый поиск fast.
Но это именно только собственно индексирующая машинка - полнотекстовый индекс и все. Все ранжирование, дубли, стат.ранк, ссылки, зеркала, спам, линковвая накрутка и тп и тд - вне движка. Самописное. И оно по размеру БОЛЬШЕ движка. Движок просто позволяет (как кажется менеджерам) экономить на железе и надежности.
Недостатки такого подхода: (1) чужого монстра на самом деле труднее укротить, чем своего. (2) Все нюансы, извлекаемые при индексации недоступны (а они могут понадобиться, системы-то все живые). (3) Все нюансы нужные в ранжировании тоже недоступны (и они тоже могут понадобиться в силу все той же "живости" веба).
Registrant: Overture Services Inc. (DOM-352367) 74 N. Pasadena Ave., 3rd Floor Pasadena CA 91103 US
А Увертюра -- это Яху. Сайт alltheweb принадлежит yahoo и поиск там стоит yahoo-вский.
Дорвеи класса "нежить" органолептически определяются достаточно просто, по многим признакам. Наметанному глазу достаточно одного взгляда.
А что такое "Экслеровские ссылки"?
я не вижу здесь серьезных проблем с точки зрения законодательства. правила оказания услуг вполне могут подразумевать соблюдение тех или иных условий. например бесплатный хостинг может запрещать баннерную рекламу и тп.
В качестве примера: Народ.Ру, кажется, единственный хостинг Рунета, в ПС которого (с самого основания) прописан пункт про запрет поискового спама. В текущей формулировке это звучит так: {загрузки, посылки, передачи или любого другого способа размещения не разрешенной специальным образом рекламной информации, спама (в том числе и поискового)}.
Наскольок я понимаю, поисковый спам на остальный хостингах официально разрешен. Не делается ничего для противодействия ему, не отрабатываются жалобы, не удаляются сайты, не фиксируются систематические нарушители и тд.
Возможно потому что эта проблема считалась несущественой.
При цене домена стремящемся к нулю, радоваться тому, что за отчетный период среди моря нежити будет регистрироваться исчезающе малое количество нормальных доменов, могут только глубоко ослепшие люди.
Если "помощь всем миром" - это осознание спама как общественного зла, то да, конечно неплохо было бы такую помощь почувствовать.
Конечно есть люди, особенно занятые в этом бизнесе, которые будут активно защищать спам, это очевидно, вот и ваши комментарии, например, тоже об этом свидетельствуют.
google.ru
google.com
labs.google.com/accessible
(в сторону: вся выдача в "гречке" - русская читалка ломается
вусмерть, саечка 15-ти журналистам, которые даже проверить
поленились)
http://www.beyou.org.uk/beconnected/view…
какой-то джанк полный, для слабовидящих ничего
http://www.steelfactor.ru/forum/index.ph…
помечено как doc
http://ifun.ru/comments/joke4555.html
для слепых не пригодная страницы вообще
* а серьезно: где примеры русских запросов?
* отличия близки к нудю
* отличия НИКАК НЕ связаны с accesibility
Главное в этом сервисе: приспособленность поисковой выдачи к программам-читалкам.
Каковую приспособелнность мы и отладили два года назад по просьбе наших родственников (которым это было РЕАЛЬНО нужно, см пресс-релиз).
я не заметил ни по одному запросу никакой разницы.
Понятно что журналисты, оосбенно вне индустрии, это ни знать, ни проверять не обязаны. Но habr мог бы установить добрую традицию: проверять все. А то получается что на habr нет никакой добавочной инофрмации.
http://en.wikipedia.org/wiki/Peter_Norvi…