Comments 70
Смех смехом, а на 200 000 пользовательских обращений нап приходится обрабатывать 800 000 обращений от роботов и ботов.
А вообще суть вашей проблемы не представляется ясной.
А вообще суть вашей проблемы не представляется ясной.
+8
Я не описываю случившееся как проблему — лично для меня трафик бесплатен. Речь о самом феномене — различиях в работе поисковых ботов, столь разительных…
0
Я имел в виду, что сходу не ясно, может у вас там есть что индексировать и яндекс просто этим лучше всех справляется
+2
Совершенно не исключено. Это и хотелось бы выяснить…
0
а может он просто заблудился?
+33
Проголодался =)
+6
А зря смеетесь :-) «Заблудить» бота не так-то и сложно, у меня было. Достаточно заиметь циклические ссылки, которые бесконечно множатся в глубину, можно с одинаковым контентом (вобщем если кому интересно, могу подробнее). Так ли это, проверить легко, достаточно взглянуть на количество страниц в индексе поисковика по выбранному сайту.
+11
Аэто только в последние месяцы? Может, после покупки Рамблера Гуглом, яндексовские боты стали более агрессивными? Чтоб уж точно не упустить пальму первенства?
-5
Тише… забанят… :-)
-11
Тогда забаньте его и всего делов. С одной стороны жалуются — сайт не индексируют или плохо индексируют, с другой стороны — слишком много индексирует. Честно говоря 5 Гб исходящего трафика для проекта в МЕСЯЦ — это капля в море (сужу по обычным проектам с 10К посетителей).
Также можно посоветовать разместить сайт, где трафик условно бесплатен при поддержке соотношений.
Также можно посоветовать разместить сайт, где трафик условно бесплатен при поддержке соотношений.
+1
Вот, кто-то ждет каждого появления Яндекса на своем сайте и лезет позиции проверять ежечасно, а кто-то жалуется на это. (Но вообще 5 гигов — это, конечно, не хило)
0
Как-то возникала подобная ситуация, яндекс стал кушать до 600 Мбайт в день (точнее за ночь). Проблему вычислили достаточно быстро — множество различных адресов для практически одинакового контента. Как решение — для части адресов запретили индексацию, некоторые действия перевели на javascript. В итоге всё вернулось на круги своя.
+7
а может кто то под видом яндексбота парсит ваш сайт? ))
+1
Почти наверняка Яндекс качает какую-нибудь одну страничку миллион раз. И Google и Yandex это обычно просекают, но, видать, у вас что-то не сработало. Посмотрите в логи и выясните — откуда у вас вообще взялось такое количество «разных» страниц и нет ли где-нибудь ссылок на страницы типа http://yourdomain/forum/view.php? id=42&refresh=1219858995
+3
Нет, весь трафик идет исключительно на /index.php…
0
Тогда может стоит выставить какое-нибудь кеширование главной? Начиная от HTTP-заголовков, заканчивая обычной статикой — а то ведь наверняка приходит бот на главную и каждый раз «новое узнаёт».
+1
А там может часики с временем в милисекундах или скорость загрузки страницы?
0
UFO just landed and posted this here
Двже боюсь представить, что будет, когда заблудится бот Гугла :)
+3
Несколько моих сайтов хостер неожиданно отключил. На вопрос? «За что?» обнаружил в логах превышение допустимых нагрузок из за запросов поисковой машины яндекса.
Это стало двойным неприятным сюрпризом. Первое за то что яндекс дает нагрузку побольше чем все пользователи вместе взятое, а второе что хостер не ограничивает потолком возможного потребления ресурсов -а дает возможность превысить этот потолок и отключает за превышение (превышение процессорной нагрузки).
Хорошо еще, что через пару месяцев после неприятного случая хостер все таки добавил возможность не превышать установленный лимит
Это стало двойным неприятным сюрпризом. Первое за то что яндекс дает нагрузку побольше чем все пользователи вместе взятое, а второе что хостер не ограничивает потолком возможного потребления ресурсов -а дает возможность превысить этот потолок и отключает за превышение (превышение процессорной нагрузки).
Хорошо еще, что через пару месяцев после неприятного случая хостер все таки добавил возможность не превышать установленный лимит
+2
«кусок минеральной породы» — некорректное словосочетание.
Правильно: кусок горной породы, так как, по всей видимости, имеется ввиду камень.
Я, как учившийся на геологическом факультете, не мог это просто так оставить, уж извините за назойливость.
Правильно: кусок горной породы, так как, по всей видимости, имеется ввиду камень.
Я, как учившийся на геологическом факультете, не мог это просто так оставить, уж извините за назойливость.
+13
Яндекс решил подхватить аудиторию.
0
Попробуйте в robots.txt прописать директиву Crawl-delay (задержка между запросами паука).
Видел похожую проблему, где за месяц бот Яндекса 1300 раз искал favicon.ico на сайте, хоть нигде он не был указан. Вот так он вымагает у вебмастеров, чтобы они иконки выкладывали.
Видел похожую проблему, где за месяц бот Яндекса 1300 раз искал favicon.ico на сайте, хоть нигде он не был указан. Вот так он вымагает у вебмастеров, чтобы они иконки выкладывали.
+3
Пару дней назад словил 35к заходов яндекса в сумме на три сайта.
С месяц назад словил 78к заходов гугля, в сумме на три сайта.
На один сайт залезло 45к роботов и 10к человек, на другой 15к человек и 25к роботов.
И наверное второй сайт лучше :). Полезнее :)
Итак о чем я…
Красная линия показывает сколько БОТ заходит
Зеленая — сколько человек переходит с сайта
График строиться на основе тех данных которые юзера разрешили считать в сумме. 60% графика получается суммой пары сотен сайтов по 10 посещений в день :)
график Яндекса
график гугля
на главной www.scanlog.ru/ можно просто сводную статистику посмотреть.
Детальную дает только по прямым адрессам.
В общем тоже самое что и webalizer|aw_stats только онлайн :)
С месяц назад словил 78к заходов гугля, в сумме на три сайта.
На один сайт залезло 45к роботов и 10к человек, на другой 15к человек и 25к роботов.
И наверное второй сайт лучше :). Полезнее :)
Итак о чем я…
Красная линия показывает сколько БОТ заходит
Зеленая — сколько человек переходит с сайта
График строиться на основе тех данных которые юзера разрешили считать в сумме. 60% графика получается суммой пары сотен сайтов по 10 посещений в день :)
график Яндекса
график гугля
на главной www.scanlog.ru/ можно просто сводную статистику посмотреть.
Детальную дает только по прямым адрессам.
В общем тоже самое что и webalizer|aw_stats только онлайн :)
+1
Если бы боты могли по рекламным баннерам щелкать, наверное никто уже и не жаловался бы на трафик: D
+2
у меня рекордсменом по трафу является бот Yahoo, качающий с сайтов раза в 4 больше чем яндекс с google'ом
а яндекс с google'ом примерно поровну
а яндекс с google'ом примерно поровну
+1
Если бы боты перед тем как начать качать трафик умели регистрироваться на сайте, то владельцы стартапов тоже думаю не жаловались бы… :)
+1
социальная сеть для ботов, anyone?
+5
Хабрамистика.
Что есть undefined?
Что есть undefined?
+1
Изменение рейтинга комментов идет с помощью AJAX, без перезагрузки страницы, а значит цифру ставит java script. Undefined скрипт выдает, когда не определена переменная или ее тип. Причин может быть несколько- не до конца загрузился скрипт, произошел сбой при передаче данных с сервера в браузер и т.п. Обновите страницу и все должно прийти в норму.
0
Вот интересно, можно ли траффик, созаваемый ботами, монетизировать?
+2
А ты что думал, у тебя не какая нибудь страничка васи пупкина… У тебя хабрахабр, это же дохрена страниц!
0
Сделайте sitemap. Там можно устанавливать периоды индексации для каждой страницы, например, раз в неделю.
Подробнее см. webmaster.yandex.ru
Подробнее см. webmaster.yandex.ru
+3
UFO just landed and posted this here
Хм. А как с к-вом переходов с Яши? Если наблюдается резкий рост — я бы расширил канал, и тихо радовался :)
0
UFO just landed and posted this here
Проверьте, правильно ли выдает ваш iddex.php время содания документа и expired. Если у Вас страница меняется раз в секунду, то робот имеет основания раз в секунду ее и обновлять. Укажите роботу, как часто нужно заходить.
0
Яндекс. Искалось ВСЕ :)
0
«Бог Яндекса сошел с ума»
так и хочется перефразировать…
так и хочется перефразировать…
0
Sign up to leave a comment.
Бот Яндекса сошел с ума?