Все потоки
Поиск
Написать публикацию
Обновить
6
0
UseShots @UseShots

Пользователь

Отправить сообщение
Это они в HTML вставлять рекомендуют. JS совсем другой зверь. Для него у гугла чётких рекомендаций нет. Разве что дублировать важные части проcтым HTML.
Ну поле для разных экспериментов обширно, так как трюков можно придумать множество, а официальной информации о том, что и как интерпретируется googlebot'ом в скриптах, почти нет.
Абсолютно согласен на счёт POST-запросов и заполненных форм.

Так гугл-бот подпишется на все рассылки, начнет отправлять липовые заказы, удалять пользователей и списывать деньги со счетов ;)
Возможно и так. А возможно и выполнил. С пустым значение тоже самое получится. А уж строчки складывать он, думаю, умеет. Вот выше есть ссылка, где у народа и зашифрованную ссылку робот подхватывал.

В любом случае, какую-то логику скрипта нужно понимать, чтоб ссылки правильно выдирать.
Не. В одном случае plain/text в другом простой HTML гружу (фрагменты реальной страницы). Суть дела правда это почти не меняет.
Ну если люди с гугла в официальном блоге говорят, что Googlebot разбирает и частично выполняет JS, то не вижу повода им не верить.

На счёт Google Toolbar я высказал в статье свои сомнения.
На счёт Oper'ы - не исключено. Может кто-то Оперой заходил и наследил.
Правда тут теже сомнения, что и в случае с Google Toolbar: почему в индекс попал урл с пустым параметром, если в реальной жизни такого не могло появиться?
Спасибо за ссылку. Для полноты картину - то что нужно.

Моя статья дабавляет к той ещё несколько аспектов:
1). ссылки определяются не только в JS-редиректах, но и в строках с HTML-кодом, и в AJAX-запросах.
2). ссылки могут быть относительными.
3). боты не только ходят по ссылкам, но и индексируют найденные таким образом страницы.
сам себе отвечаю: можно просекать, что хитрый гугл GET-ом вместо POST-а лезет и подсовывать ему страницу с meta noindex.

Правда тут cloaking'ом попахивает. Подожду пока. Посмотрю, как он на Disallow отреагирует.
А куда "ноиндекс" добавлять? У меня же Ajax'ом не полные страницы подгружаются, а кусочки. Там нет meta тэгов :(
Приходится Disallow спасаться
Ну вероятность попадания скрипта в результаты гугла пока маловероятно. О нагрузке на их бот я мало волнуюсь. Мне скорее вазна нагрузка на мой сервер.

А вот попадание "недостраниц" в результаты поиска, как в моём случае, весьма нежелательно. Для них точно нужно Disallow добавлять. Хотя для одного из таких урлов Disallow уже почти месяц как добавлен, а он всё ещё в индексе.
Клиент выдал? ;-)
То что Googlebot понимает и частично выполняет JS, про это Гугловчане открытым текстом говорят. Я же привёл цитаты с их официального блога.

Вопрос в том, при каких условиях googlebot это делает и какие у него ограничения.
В спецификации написано, как страницы строить и как браузерам их показывать. А про то, что со всем этим googlebot делать будет, там ничего нет ;-)

У меня ж форме прописано method="post", да и в JS тоже post отправляется. Понятно, что роботу легче get отправить - вдруг прокатит. Меня удивило, что он сам УРЛ из JS достал, так как форма сабмитится только из JS.

А на счёт robots.txt - это правильно. Добавил несколько Disallow, чтоб робот не лез, куда не просят.
Я и не собираюсь менять пока. Не люблю подобные стрессы ;)

Хочу лишь глянуть для ознакомления и общего развития. Надо время от времени знакомиться с тем, что творится вокруг. Иногда лишь для того, чтоб сразу же забить, а иногда, чтоб подчерпнуть какую-нибудь новую идею, или вообще понять, что это то, чего тебе так долго не хватало (в таких случаях переход осуществляется легко и приятно).
O! E-TextEditor снова развивается! Когда последний раз заглядывал на сайт, там было довольно долгое затишье в обновлениях. Я решил тогда тоже подождать. Тем временем настроил как надо jEdit.

Может пришло время очередной раз глянуть на E-TextEditor.
А в каком виде сама программа получается. Что с ней распространять надо? Запустится ли она на машине где нет Питона и Qt?
Мне кажется, это из-за широких комментов. Там в верху есть длинный URL непереносимый, и ещё чуть ниже картинка широкая вставлена. От этого IE6 и бесится.
Кстати, загрузил сейчас на этот топик в IE6, и дизайн Хабра расползся. Вверху много пустого места, а текст начинается экраном ниже, прямо под правым сайдбаром с "прыгающим мячиком". И это даже если полностью распахнуть окно на моём широкоформатном 20-ти дюймовом мониторе.

Мы тут дискутируем, а тем временем Хабр похоже уже отказался от поддержки IE6 ;-)
Я оставил все названия из оригинального поста. Хотя Мэт скорее всего имел в виду iPod, но к концу статьи потерял концентрацию и выдал iTouch ;-)

Лично меня больше заинтересовал PlayStation Portable. Я за подобными вещами не слежу и был немного удивлён, что игровые девайсы теперь используют для вэб сёрфинга. Хотя почему бы и нет ;-)
Продолжу переводить.

Как в 37signal аргументируют свой ход конём о прекращении поддержки IE6 после 15 августа 2008:

Почему мы это делаем?
IE6 – это браузер прошлого поколения. Это значит, что IE6 не может предоставить уровень работы с веб сайтами, сопоставимый с тем, что предоставляют современные браузеры. Если мы продолжим подерживать IE6, то не сможем оптимизировать и улучшать интерфейс наших приложений. Поддержка IE6 означает более медленный прогресс, меньший прогресс, а местами и вовсе полное отсутствие прогресса. Мы хотим, чтоб подавляющее большинство наших клиентов имело наилучшие впечатления от работы с нашими приложениями, в то время как поддержка IE6 связывает нам руки.


И ещё интересный момент:

Специально для тех, кто использует Basecamp совместно с клиентами: Если ваши клиенты используют IE6 (спросите их), вы возможно захотите помочь им проапгрейдить браузеры. ;-)

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность