Comments / Profile of asdoc / Habr

@asdoc

Homo sapiens

ProfileArticles7PostsNewsComments225

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 11:08

«не публичный фильтр завуалированный под несовершенство системы» — шикарно!

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 09:39

Сверхрелевантная выдача… Все, что нужно знать о качестве Яндекса.

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 09:38

Т.е. речь в моем посте идет об одинаковых текстах. Точных копиях. Т.е. ничего нового не появилось. Максимум — дата публикации.
Таким образом «актуальность контента» и «устаревание» одинаковое.
Разумеется, речь идет о качественном контенте. Плохие тексты не воруют.
И в результате я вижу в выдаче 70 копий моей статьи на сайтах копипастерах. И не вижу своего оригинала нигде.

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 09:01

" Яндекс — зеркало Рунета".
По факту — ложь.
Зеркало отражает «как есть». Значит оригинал текста должен быть выше копипаста.
А пока Яндекс — кривое зеркало Рунета.

-2

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 08:59

Вероятно, промолчит или скажет, что «такого не может быть, потому что не может быть никогда». И только Яндекс умный, а остальные…

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 08:56

Да. Но иного в голову не приходит, ибо за 5 лет все иные варианты проверены.

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 10 2017 at 08:55

Если Ваша авторская статья выше моей авторской, то нет никаких проблем. Это и сравнивать трудно.
Речь о тупом копипасте, который Яндекс показывает выше первопубликации — оригинального текста.

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 9 2017 at 23:00

Спасибо за поддержку. Дополню.
У меня как раз очень старый и в прошлом очень популярный ресурс, который как раз из-за того, что Яндекс вместо моих тестов показывает копипасты (а их десятки на каждую статью), стал гораздо менее популярным. За 5 лет примерно в 8 раз!

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 9 2017 at 21:05

Ну уже 5 лет как не исправляют и даже не «чешутся».

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 9 2017 at 20:11

Еще один вариант ответа, не вполне согласующийся с текстом статьи такой.
И это итог многолетнего исследования.
У Яндекса есть тайный, не публичный фильтр.
Как устроен тайный фильтр Яндекса?
Очень просто. Если сайт отвечает всем техническим требованиям Яндекса, если на нем расположена хорошая и оригинальная информация, но сайт по каким-то причинам, назовем их «личными», не устраивает Яндекс, то происходит вот что.
Сайт исправно индексируется и в Вебмастере видно, что все страницы «находятся в поиске».
Но на самом деле, из выдачи постепенно выпадают страницы сайта.
Страница за страницей.
Вместо них появляются страницы сайтов-воров, скопипастивших текст.
Т.е. пока текст никто не своровал, Яндекс выдает их на пессимизируемом «по личным соображениям» сайте. Но как только этот же текст появляется на сайте копипастера, то страница сайта первоисточника из поиска выпадает, а остается страница сайта-копипастера.
При этом сайт-первоисточник, по всем публично озвученным Яндексом требованиям, может многократно превосходить сайт-копипастер. Но в выдаче будет только копипастер.
Такая вот оригинальная «блокировочка».
Действует она примерно с 2012 года.
Что это дает Яндексу? Видимо так Яндекс проявляет свою «лояльность». (Хотя сайт, пропадающий из выдачи, может быть любой нейтральной тематики).
К чему это приведет? К тому, что строчка в резюме «работал в Яндекс» будет восприниматься как минус при последующем трудоустройстве.
Ну а Яндекс, разумеется, продолжит терять долю рынка.
Как писали С.Левитт и С.Дабнер «информация представляет собой валюту Интернета», а раз так, то исключая первопубликации из выдачи, Яндекс обворовывает авторов и способствует «продаже краденного».
Так что вопрос многомилионных исков к Яндексу это лишь вопрос времени.

Как черные SEO-оптимизаторы собирают миллионы посетителей по высоко-актуальным запросам в Яндексе

asdoc Nov 9 2017 at 20:09

100% верно, 100% точно, 100% правда.
«Яндекс тоже проиндексировал эту страницу, но все равно считает, что свежий дубликат актуальнее других сайтов.» — главная фраза статьи.
Компилятор, копипастер, вор крадет чужой контент, меняет дату и выдает за свой.
Я писал об этом Яндексу много раз. Много лет. В том числе лично сотрудникам.
Толку — ноль.
Яндексу видимо выгодно поощрять воровство и копипаст.
При этом у Яндекса был механизм отсекания копипаста и выдача копипаста ниже первопубликации в 2010-2011 году.
А потом Яндекс на это «забил».

А на самом деле ведь все очень просто. Есть web.archive.org на котором есть копии всех текстов с датами первопубликаций.
Индексируется web.archive.org, сравнивается с базой текстов и выдается первым самый старый текст. Таким образом копипастеры оказываются ниже или вылетают.
Ведь текст у копипастера не изменен. Это точная копия. Он же ничего, кроме как воровать не умеет. Писать тексты не умеет.
Почему Яндекс это не делает — загадка.
Почему подсовывает пользователям продукт «второй свежести» — непонятно.
Вероятно, Яндекс не уважает ни авторов, ни вебмастеров, ни пользователей.
Проще всего послать Яндекс в ответ и пользоваться Гууглом.
Другого выхода я не вижу.

+16

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Oct 31 2017 at 08:07

Шаманские танцы и реальность Яндекса.
Или почему этот текст Тимура Гаскарова не имеет смысла.
Итоги многолетнего исследования.
Как устроен тайный фильтр Яндекса?
Очень просто. Если сайт отвечает всем техническим требованиям Яндекса, если на нем расположена хорошая и оригинальная информация, но сайт по каким-то причинам, назовем их «личными», не устраивает Яндекс, то происходит вот что.
Сайт исправно индексируется и в Вебмастере видно, что все страницы «В поиске».
Но на самом деле, из выдачи постепенно выпадают страницы сайта.
Страница за страницей.
Вместо них появляются страницы сайтов-воров, скопипастивших текст у первоисточника.
Т.е. пока текст никто не своровал, Яндекс выдает их на пессимизируемом «по личным соображениям» сайте. Но как только этот же текст появляется на сайте копипастера, то страница сайта первоисточника из поиска выпадает, а остается страница сайта-копипастера.
При этом сайт-первоисточник, по всем публично озвученным Яндексом требованиям, может многократно превосходить сайт-копипастер. Но в выдаче будет только копипастер.
Такая вот оригинальная «блокировочка».
Действует она примерно с 2012 года.
Что это дает Яндексу? Видимо так Яндекс проявляет свою «лояльность». (Хотя сайт, пропадающий из выдачи, может быть любой нейтральной тематики).
К чему это приведет? К тому, что строчка в резюме «работал в Яндекс» будет восприниматься как минус при последующем трудоустройстве.
Ну а Яндекс, разумеется, продолжит терять долю рынка.
Как писали С.Левитт и С.Дабнер «информация представляет собой валюту Интернета», а раз так, то исключая первопубликации из выдачи, Яндекс обворовывает авторов и способствует «продаже краденного».
Так что вопрос многомилионных исков к Яндексу это лишь вопрос времени.

-2

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Sep 3 2017 at 13:28

В качестве примера того, что нет никакой проблемы определить и поставить оригинал выше копипаста, можно не только Гуугл привести, но и TinEye — около картинок даже стоят даты.
Ведь копипаст ничего не привносит ни в текст, ни в картинку. Пользы читателю, пользователю от копипаста — ноль.
И при этом Яндекс уверяет, что копипаст ценнее для пользователя… Ведь у него есть шаманский танец под названием «поведение пользователя» и молитва «Матрикснет»…
Это примерно как уверять, что репродукция или глянцевый постер дороже, чем оригинальная картина.

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Sep 2 2017 at 19:17

Особенно ценен данный совет для текстов, опубликованных 10 лет назад и более, и скопипащеных по нескольку десятков раз каждый.
Что касается «кто-то разрешает», то я таковых за 20 лет не видел ни одного.
Копипастить и получить разрешение на публикацию — две большие разницы!
Копипаст — воровство. Перепечатка с разрешения — нормальная практика.
Однако в любом случае в поисковой выдаче копия должна быть ниже оригинала.
Иначе нет никакого смысла писать хорошие тексты.
В результате интернет полон бездумными дешевыми копирайтерскими текстами.
Отличить копипаст от оригинала для Яндекса дело очень простое.

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 31 2017 at 14:54

Прекрасно, конечно… но вот реплика от техподдержки. Сегодняшняя.
«Наш робот сейчас не поддерживает межхостовый атрибут rel=»canonical", поэтому ссылки на другой сайт www… ru/ будут им игнорироваться."
Т.е. примерно за 10 лет существования мобильных версий сайтов Яндекс не научился корректно обрабатывать атрибут rel=«canonical», указывающий где мобильная, а где классическая версии страницы.
Сколько для такого умения нужно написать строк кода? Две? Пару десятков?
И за 10 лет 3000 сотрудников Яндекса с этим не справились!
Тогда о каком Матрикснете, о каком искусственном интеллекте, о каком качестве можно говорить?
Ау, господа из Яндекса! Может сначала научиться решать простые задачи, а потом уже переходить к более сложным?

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 30 2017 at 19:07

И нет совсем никакой проблемы для Яндекса просканировать место хранения копий всех текстов — web. archive. org/web — там все по полочкам, с датами.
Текст привязывается к странице с самой ранней датой публикации. С наибольшей долей вероятности — это первоисточник.
Конечно, есть некоторое запаздывание в работе самого web. archive. org, но для текстов до 2003 года не существенное. А повальное воровство и копипаст как раз начались позже. А может сейчас web. archive. org и пошустрее работает.
Впрочем, используя свои базы (Яндекса), вебархив, «оригинальные тексты», — все, где любой текст так или иначе привязывается к дате, довольно просто при выборе какой вариант идентичного текста показывать — выбирать текст с самой ранней датой публикации.
А потом показывать иной текст (совсем иной), тоже выбрав по наиболее старой дате публикации.
И пусть эти два разных текста конкурируют качеством, юзабилити, поведением пользователя и пр.
А копии просто отбрасывать, не показывать в выдаче. Это же мусор. Вроде как никто не превращает свою квартиру в мусорное ведро — выносят мусор? Так зачем превращать поисковую выдачу в помойку?
В итоге освободится место для множества оригинальных текстов. А не так, как сейчас — на 10 позиций выдачи — 2-4 повтора одного и того же текста в разном дизайне.

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 30 2017 at 14:23

А вот еще дополнение моим словам от незнакомого мне пользователя (из личной переписки, с согласия автора)…
«С 2014 тоже боремся с подобной проблемой, только на коммерческом сайте. В нашем случае кончилось тем что Яндекс признал признал ошибку алгоритма и даже обещал исправить, но воз и ныне там.»

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 30 2017 at 13:04

Небольшое дополнение.
Исходя из лозунга Яндекса «делайте сайты для людей»…
Автор приносит свой текст, свои идеи, сайт-источник, первопубликатор — находит автора, договаривается, публикует.
После этого это текст индексируется и показывается пользователю поисковой системой.
Это все «для людей».
Без автора — нет текста. Без первопубликации нет он-лайн доступа, без поиска нет быстрого обнаружения текста.
А что привносит «для людей» копипастер? Занимает место в выдаче?, Размещает много блоков Яндекс-Директа? Меняет фон или шрифт? Стирает подпись? Не указывает источник? Разбивает текст рекламой? Изменяет слова, искажая текст? Правильно прописывает ключевые слова и прочие технические примочки, которые пользователь не видит?
Что из этого «для людей»?
Чем тексты на сайте копипастере для людей лучше, чем на сайте-источнике?

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 29 2017 at 15:00

Так и меня, Тимур, никто за Гуугл не агитировал. Мне пришлось уйти, так как Яндекс не находил нужных мне ответов. А Гуугл находил.
Думаете, что я хотел уйти? Я очень консервативен — не люблю смену интерфейса. А в Гуугл все немножко иначе. Поначалу непривычно было.
В конце концов давайте мы с Вами договоримся — ничего не падает, все растет. Пусть у нас будет такая «легенда».
Мы же не об этом, а о качестве поиска.
Вы сами сказали, что качество — это клиенты. Новые или удержанные.
Я предложил небольшое улучшение и механизм. (Смотрите личные сообщения).
Посмотрите на комментарии здесь и их оценки. Проблема копипаста важна многим. Очень многим. Решить ее можно довольно просто и быстро. И это улучшит качество поиска и стимулирует авторов на конкуренцию текстами. Т.е. выиграют все — авторы, читатели, Яндекс.
(Кроме воров-копипастеров, конечно).
Яндексу мешает мусор в выдаче? Это уберет мусор.
Яндекс хочет дать больше вариантов ответа на вопрос? Без мусора ответов будет больше.
Яндекс хочет, чтобы было меньше СЕО-шных г-сайтов? Наверно. Иначе не делал бы АГСы.
Убрать копипасты, оставить первопубликации — и будет меньше г-сайтов.
Я думаю, что цели авторов, Яндекса и добросовестных веб-мастеров совпадают.
Или я не прав?

Как Яндекс научил искусственный интеллект понимать смысл документов

asdoc Aug 29 2017 at 14:28

Не так. Если меня опубликовал журнал — он мне заплатил.
И он первым опубликует это в сети. Это нормально. И он должен быть первым в выдаче, так как у него первопубликация. И он может сообщить читателю мои координаты, если читателю нужно. И я разрешил эту публикацию.
В этом случае как раз моя публикация будет вторичной. Хотя и не вполне. Авторская версия почти всегда имеет отличия от журнальной.
И разговор идет не про сайт. Яндекс не рейтинг. Разговор идет о позиции оригинального текста в выдаче. Это привязано к странице, тексту и дате публикации.
Что касается «где интереснее», то у меня более 5000 разных текстов. Все интересные. Это вполне конкурентноспособно, относительно сайта журнала.
И не стоит равнять компипаст г-сайты и сайты журналов. Журналы копипастом не занимаются. Это прерогатива воров-копипастеров.

1 2 ...

6 7

9 10 11 12