Это они в HTML вставлять рекомендуют. JS совсем другой зверь. Для него у гугла чётких рекомендаций нет. Разве что дублировать важные части проcтым HTML.
Ну поле для разных экспериментов обширно, так как трюков можно придумать множество, а официальной информации о том, что и как интерпретируется googlebot'ом в скриптах, почти нет.
Возможно и так. А возможно и выполнил. С пустым значение тоже самое получится. А уж строчки складывать он, думаю, умеет. Вот выше есть ссылка, где у народа и зашифрованную ссылку робот подхватывал.
В любом случае, какую-то логику скрипта нужно понимать, чтоб ссылки правильно выдирать.
Ну если люди с гугла в официальном блоге говорят, что Googlebot разбирает и частично выполняет JS, то не вижу повода им не верить.
На счёт Google Toolbar я высказал в статье свои сомнения.
На счёт Oper'ы - не исключено. Может кто-то Оперой заходил и наследил.
Правда тут теже сомнения, что и в случае с Google Toolbar: почему в индекс попал урл с пустым параметром, если в реальной жизни такого не могло появиться?
Спасибо за ссылку. Для полноты картину - то что нужно.
Моя статья дабавляет к той ещё несколько аспектов:
1). ссылки определяются не только в JS-редиректах, но и в строках с HTML-кодом, и в AJAX-запросах.
2). ссылки могут быть относительными.
3). боты не только ходят по ссылкам, но и индексируют найденные таким образом страницы.
Ну вероятность попадания скрипта в результаты гугла пока маловероятно. О нагрузке на их бот я мало волнуюсь. Мне скорее вазна нагрузка на мой сервер.
А вот попадание "недостраниц" в результаты поиска, как в моём случае, весьма нежелательно. Для них точно нужно Disallow добавлять. Хотя для одного из таких урлов Disallow уже почти месяц как добавлен, а он всё ещё в индексе.
В спецификации написано, как страницы строить и как браузерам их показывать. А про то, что со всем этим googlebot делать будет, там ничего нет ;-)
У меня ж форме прописано method="post", да и в JS тоже post отправляется. Понятно, что роботу легче get отправить - вдруг прокатит. Меня удивило, что он сам УРЛ из JS достал, так как форма сабмитится только из JS.
А на счёт robots.txt - это правильно. Добавил несколько Disallow, чтоб робот не лез, куда не просят.
Я и не собираюсь менять пока. Не люблю подобные стрессы ;)
Хочу лишь глянуть для ознакомления и общего развития. Надо время от времени знакомиться с тем, что творится вокруг. Иногда лишь для того, чтоб сразу же забить, а иногда, чтоб подчерпнуть какую-нибудь новую идею, или вообще понять, что это то, чего тебе так долго не хватало (в таких случаях переход осуществляется легко и приятно).
O! E-TextEditor снова развивается! Когда последний раз заглядывал на сайт, там было довольно долгое затишье в обновлениях. Я решил тогда тоже подождать. Тем временем настроил как надо jEdit.
Может пришло время очередной раз глянуть на E-TextEditor.
Мне кажется, это из-за широких комментов. Там в верху есть длинный URL непереносимый, и ещё чуть ниже картинка широкая вставлена. От этого IE6 и бесится.
Кстати, загрузил сейчас на этот топик в IE6, и дизайн Хабра расползся. Вверху много пустого места, а текст начинается экраном ниже, прямо под правым сайдбаром с "прыгающим мячиком". И это даже если полностью распахнуть окно на моём широкоформатном 20-ти дюймовом мониторе.
Мы тут дискутируем, а тем временем Хабр похоже уже отказался от поддержки IE6 ;-)
Я оставил все названия из оригинального поста. Хотя Мэт скорее всего имел в виду iPod, но к концу статьи потерял концентрацию и выдал iTouch ;-)
Лично меня больше заинтересовал PlayStation Portable. Я за подобными вещами не слежу и был немного удивлён, что игровые девайсы теперь используют для вэб сёрфинга. Хотя почему бы и нет ;-)
Почему мы это делаем?
IE6 – это браузер прошлого поколения. Это значит, что IE6 не может предоставить уровень работы с веб сайтами, сопоставимый с тем, что предоставляют современные браузеры. Если мы продолжим подерживать IE6, то не сможем оптимизировать и улучшать интерфейс наших приложений. Поддержка IE6 означает более медленный прогресс, меньший прогресс, а местами и вовсе полное отсутствие прогресса. Мы хотим, чтоб подавляющее большинство наших клиентов имело наилучшие впечатления от работы с нашими приложениями, в то время как поддержка IE6 связывает нам руки.
И ещё интересный момент:
Специально для тех, кто использует Basecamp совместно с клиентами: Если ваши клиенты используют IE6 (спросите их), вы возможно захотите помочь им проапгрейдить браузеры. ;-)
Так гугл-бот подпишется на все рассылки, начнет отправлять липовые заказы, удалять пользователей и списывать деньги со счетов ;)
В любом случае, какую-то логику скрипта нужно понимать, чтоб ссылки правильно выдирать.
На счёт Google Toolbar я высказал в статье свои сомнения.
На счёт Oper'ы - не исключено. Может кто-то Оперой заходил и наследил.
Правда тут теже сомнения, что и в случае с Google Toolbar: почему в индекс попал урл с пустым параметром, если в реальной жизни такого не могло появиться?
Моя статья дабавляет к той ещё несколько аспектов:
1). ссылки определяются не только в JS-редиректах, но и в строках с HTML-кодом, и в AJAX-запросах.
2). ссылки могут быть относительными.
3). боты не только ходят по ссылкам, но и индексируют найденные таким образом страницы.
Правда тут cloaking'ом попахивает. Подожду пока. Посмотрю, как он на Disallow отреагирует.
Приходится Disallow спасаться
А вот попадание "недостраниц" в результаты поиска, как в моём случае, весьма нежелательно. Для них точно нужно Disallow добавлять. Хотя для одного из таких урлов Disallow уже почти месяц как добавлен, а он всё ещё в индексе.
Вопрос в том, при каких условиях googlebot это делает и какие у него ограничения.
У меня ж форме прописано method="post", да и в JS тоже post отправляется. Понятно, что роботу легче get отправить - вдруг прокатит. Меня удивило, что он сам УРЛ из JS достал, так как форма сабмитится только из JS.
А на счёт robots.txt - это правильно. Добавил несколько Disallow, чтоб робот не лез, куда не просят.
Хочу лишь глянуть для ознакомления и общего развития. Надо время от времени знакомиться с тем, что творится вокруг. Иногда лишь для того, чтоб сразу же забить, а иногда, чтоб подчерпнуть какую-нибудь новую идею, или вообще понять, что это то, чего тебе так долго не хватало (в таких случаях переход осуществляется легко и приятно).
Может пришло время очередной раз глянуть на E-TextEditor.
Мы тут дискутируем, а тем временем Хабр похоже уже отказался от поддержки IE6 ;-)
Лично меня больше заинтересовал PlayStation Portable. Я за подобными вещами не слежу и был немного удивлён, что игровые девайсы теперь используют для вэб сёрфинга. Хотя почему бы и нет ;-)
Как в 37signal аргументируют свой ход конём о прекращении поддержки IE6 после 15 августа 2008:
Почему мы это делаем?
IE6 – это браузер прошлого поколения. Это значит, что IE6 не может предоставить уровень работы с веб сайтами, сопоставимый с тем, что предоставляют современные браузеры. Если мы продолжим подерживать IE6, то не сможем оптимизировать и улучшать интерфейс наших приложений. Поддержка IE6 означает более медленный прогресс, меньший прогресс, а местами и вовсе полное отсутствие прогресса. Мы хотим, чтоб подавляющее большинство наших клиентов имело наилучшие впечатления от работы с нашими приложениями, в то время как поддержка IE6 связывает нам руки.
И ещё интересный момент:
Специально для тех, кто использует Basecamp совместно с клиентами: Если ваши клиенты используют IE6 (спросите их), вы возможно захотите помочь им проапгрейдить браузеры. ;-)