переводчику следует более внимательно относиться к оформлению текста и орфографии, опечатки и ошибки режут глаза
статья как эсперимент - забавная. но не более.
Вопрос в том, нАСколько...
НАСколько я знаю...
До сегодняшних пор (звучит криво, поменять на что-либо более удобочитаемое вроде "До сих пор")
чесать голову в попытках понять_,_ что
опытным путем_,_ моими
Определить обЪем текста
Вычислить обЪем индексируемого
ввел уникальные, нЕСуществующие
специально для эксперимента_,_ и служили
опубликованы_,_ и я пошел
НАКонец-то
Важно заметить_,_ что
экспериментов_,_ и содержат
совсем нЕЖеланная
убедился в том_,_ что
осталось сделать _-_ это проверить
страницы _ по каждому
Как вы наверноЕ
скачЕННого (вот тут я очень сомневаюсь правда ;) )
Но в тО Же самое
в выдаче Google Присутствуют
Самое главное_,_ что он индексирует
нЕСмотря на то_,_ что MSN
Казалось_,_ что если размер
меня думать_,_ что скорость
Сиречь (сомневаюсь, что в IT статье есть место для этого слова ;) )
Получается_,_ что это плохо_:_ располагать на своем сайте тексты
Если текста будет больше_,_ чем
а тот лимит_,_ где
ps: да, я понимаю, что в большинстве ошибки пунктуационные, но тем не менее... ;)
Неважно, как говорить, важно, от какого глагола образуется. "Скачано" от "скачать"; "скачено".. не знаю... скорее всего, от "скатить". Скаченный в трубочку ковер.
хм, статья хороша,но, по сути, это палево темы.
тоесть такие исследования обычно остаются закрытыми, т.к.реальный их вес огромен. также не стоит забывать,что в тройке сидят умные люди (ну по крайней мере более способные зарабатывать деньги,чем мы), и глубина просмотра бота наверняка управляется при помощи одной переменной в его среде/коде/конфиг-файле.
Думаю что глубина сканирования зависит еще от многих факторов, которые в меньшей мере поддаются внешнему анализу. Это может зависить от вместительности серверов того или иного дата-центра, с которого пришел бот, да много еще от чего.
Но по поводу палева темы соглашусь :) Если тема станет популярной, алгоритмы быстро изменятся, и все. Очередь нового эксперимента.
в тесте все страницы, судя по котексту, не имели никакой ценности для поисковиков. Возможно если бы у всех страниц был другой/разный page rank то ирезультаты могли бы быть другими. Но пропала бы чистота эксперимента.
Там, где останавливаются боты