Comments / Profile of UseShots / Habr

User

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 21:13

Это они в HTML вставлять рекомендуют. JS совсем другой зверь. Для него у гугла чётких рекомендаций нет. Разве что дублировать важные части проcтым HTML.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 18:41

Ну поле для разных экспериментов обширно, так как трюков можно придумать множество, а официальной информации о том, что и как интерпретируется googlebot'ом в скриптах, почти нет.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 13:50

Абсолютно согласен на счёт POST-запросов и заполненных форм.

Так гугл-бот подпишется на все рассылки, начнет отправлять липовые заказы, удалять пользователей и списывать деньги со счетов ;)

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 13:47

Возможно и так. А возможно и выполнил. С пустым значение тоже самое получится. А уж строчки складывать он, думаю, умеет. Вот выше есть ссылка, где у народа и зашифрованную ссылку робот подхватывал.

В любом случае, какую-то логику скрипта нужно понимать, чтоб ссылки правильно выдирать.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 13:02

Не. В одном случае plain/text в другом простой HTML гружу (фрагменты реальной страницы). Суть дела правда это почти не меняет.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 12:58

Ну если люди с гугла в официальном блоге говорят, что Googlebot разбирает и частично выполняет JS, то не вижу повода им не верить.

На счёт Google Toolbar я высказал в статье свои сомнения.
На счёт Oper'ы - не исключено. Может кто-то Оперой заходил и наследил.
Правда тут теже сомнения, что и в случае с Google Toolbar: почему в индекс попал урл с пустым параметром, если в реальной жизни такого не могло появиться?

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 12:37

Спасибо за ссылку. Для полноты картину - то что нужно.

Моя статья дабавляет к той ещё несколько аспектов:
1). ссылки определяются не только в JS-редиректах, но и в строках с HTML-кодом, и в AJAX-запросах.
2). ссылки могут быть относительными.
3). боты не только ходят по ссылкам, но и индексируют найденные таким образом страницы.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 12:12

сам себе отвечаю: можно просекать, что хитрый гугл GET-ом вместо POST-а лезет и подсовывать ему страницу с meta noindex.

Правда тут cloaking'ом попахивает. Подожду пока. Посмотрю, как он на Disallow отреагирует.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 12:07

А куда "ноиндекс" добавлять? У меня же Ajax'ом не полные страницы подгружаются, а кусочки. Там нет meta тэгов :(
Приходится Disallow спасаться

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 11:56

Ну вероятность попадания скрипта в результаты гугла пока маловероятно. О нагрузке на их бот я мало волнуюсь. Мне скорее вазна нагрузка на мой сервер.

А вот попадание "недостраниц" в результаты поиска, как в моём случае, весьма нежелательно. Для них точно нужно Disallow добавлять. Хотя для одного из таких урлов Disallow уже почти месяц как добавлен, а он всё ещё в индексе.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 11:29

Клиент выдал? ;-)

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 11:27

То что Googlebot понимает и частично выполняет JS, про это Гугловчане открытым текстом говорят. Я же привёл цитаты с их официального блога.

Вопрос в том, при каких условиях googlebot это делает и какие у него ограничения.

Googlebot теперь находит ссылки и в JavaScript’е.

UseShots Aug 7 2008 at 10:51

В спецификации написано, как страницы строить и как браузерам их показывать. А про то, что со всем этим googlebot делать будет, там ничего нет ;-)

У меня ж форме прописано method="post", да и в JS тоже post отправляется. Понятно, что роботу легче get отправить - вдруг прокатит. Меня удивило, что он сам УРЛ из JS достал, так как форма сабмитится только из JS.

А на счёт robots.txt - это правильно. Добавил несколько Disallow, чтоб робот не лез, куда не просят.

Не сниппетами единными…

UseShots Aug 6 2008 at 20:17

Я и не собираюсь менять пока. Не люблю подобные стрессы ;)

Хочу лишь глянуть для ознакомления и общего развития. Надо время от времени знакомиться с тем, что творится вокруг. Иногда лишь для того, чтоб сразу же забить, а иногда, чтоб подчерпнуть какую-нибудь новую идею, или вообще понять, что это то, чего тебе так долго не хватало (в таких случаях переход осуществляется легко и приятно).

Не сниппетами единными…

UseShots Aug 6 2008 at 18:02

O! E-TextEditor снова развивается! Когда последний раз заглядывал на сайт, там было довольно долгое затишье в обновлениях. Я решил тогда тоже подождать. Тем временем настроил как надо jEdit.

Может пришло время очередной раз глянуть на E-TextEditor.

PyQt4 — Введение

UseShots Aug 6 2008 at 14:52

А в каком виде сама программа получается. Что с ней распространять надо? Запустится ли она на машине где нет Питона и Qt?

Независимость от IE6?

UseShots Jul 6 2008 at 14:02

Мне кажется, это из-за широких комментов. Там в верху есть длинный URL непереносимый, и ещё чуть ниже картинка широкая вставлена. От этого IE6 и бесится.

Независимость от IE6?

UseShots Jul 6 2008 at 08:14

Кстати, загрузил сейчас на этот топик в IE6, и дизайн Хабра расползся. Вверху много пустого места, а текст начинается экраном ниже, прямо под правым сайдбаром с "прыгающим мячиком". И это даже если полностью распахнуть окно на моём широкоформатном 20-ти дюймовом мониторе.

Мы тут дискутируем, а тем временем Хабр похоже уже отказался от поддержки IE6 ;-)

Независимость от IE6?

UseShots Jul 5 2008 at 14:33

Я оставил все названия из оригинального поста. Хотя Мэт скорее всего имел в виду iPod, но к концу статьи потерял концентрацию и выдал iTouch ;-)

Лично меня больше заинтересовал PlayStation Portable. Я за подобными вещами не слежу и был немного удивлён, что игровые девайсы теперь используют для вэб сёрфинга. Хотя почему бы и нет ;-)

Независимость от IE6?

UseShots Jul 5 2008 at 14:18

Продолжу переводить.

Как в 37signal аргументируют свой ход конём о прекращении поддержки IE6 после 15 августа 2008:

Почему мы это делаем?
IE6 – это браузер прошлого поколения. Это значит, что IE6 не может предоставить уровень работы с веб сайтами, сопоставимый с тем, что предоставляют современные браузеры. Если мы продолжим подерживать IE6, то не сможем оптимизировать и улучшать интерфейс наших приложений. Поддержка IE6 означает более медленный прогресс, меньший прогресс, а местами и вовсе полное отсутствие прогресса. Мы хотим, чтоб подавляющее большинство наших клиентов имело наилучшие впечатления от работы с нашими приложениями, в то время как поддержка IE6 связывает нам руки.

И ещё интересный момент:

Специально для тех, кто использует Basecamp совместно с клиентами: Если ваши клиенты используют IE6 (спросите их), вы возможно захотите помочь им проапгрейдить браузеры. ;-)

3 4