Googlebot умеет понимать Javascript

    Как известно, Google индексирует миллиарды веб-страниц с молниеносной скоростью, используя Googlebot — сканер, который собирает ссылки и документы из веб-страниц и превращает их в содержимое, по которому можно искать с помощью Google Search.

    Изначально предполагалось, что Googlebot умеет только читать ссылки и парсить некоторый код, но, как на днях рассказал представитель Google редактору Forbes Тейлору Бэли, Google в настоящее время умеет более глубоко взаимодействовать с JavaScript, и боты могут даже понимать некоторый JavaScript.

    Google can parse and understand some JavaScript.


    gray пишет в своём блоге:
    Не секрет, что неспособность поисковиков интерпретировать скрипты зачастую использовалась для различных оптимизаторских целей, устройства редиректов и так далее. Будет очень интересно посмотреть на поистине тектонические изменения на рынке SEO, которые последуют теперь и позже, по мере того, как подобными возможностями обзаведутся и другие поисковики, а не только Google.


    По мнению Тейлора Бэли, вполне возможно, что понимание JavaScript стало частью изменений, связанных с Google Caffeine.

    Похожие публикации

    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 31

      0
      Еще он использует парсер для анализа скорости загрузки скриптов на странице
        +3
        а все таки, что именно он понимает, а что нет?
          0
          Если бы это сообщили — уничтожили бы фичу)
            0
            Сомневаюсь, что гугл это раскроет, в частности из-за
            Не секрет, что неспособность поисковиков интерпретировать скрипты зачастую использовалась для различных оптимизаторских целей, устройства редиректов и так далее.
            впрочем поживем — увидим, может какие-то рекомендации по поводу скриптов, которые теперь можно использовать, не боясь сделать недоступной для бота часть контента.
              +3
              Вообще-то очень давно ребята из Google сообщали об этом. Пруфлинка не найду сейчас.

              Совершенно точно распознаёт конструкции вида $('selector').load(url).
              +6
              Слишком умный бот может быть опасен для самого гугла. Кто первым напишет для него эксплойт? :-)
                +9
                Уже создал страничку с разными методами вставки текста в страницу. Посмотрим, что же он понимает.

                ссылку в location.href по событие онклик пока не один поисковик не проиндексировал. Ждём :)
                  0
                  хороший контр-аргумент.
                  +1
                  так и до аякса недалеко :)
                    0
                    я думаю, что уже.
                    сами методы индексации аякса в гугле обсуждаются очень давно, так что если научились яваскрипт парсить, то аякс, скорее всего, уже тоже
                      0
                      ну Аякс уже как-то индексируется. Например сайт www.coldfusionbloggers.org/

                      У них pagination через AJAX сделан

                      И эти страницы есть в кеше гугла:
                      www.google.com.ua/search?hl=uk&q=site:http://www.coldfusionbloggers.org+CPU&aq=f&aqi=&aql=&oq=&gs_rfai=
                        0
                        Cache

                        Сорри, такая ссылка
                          0
                          Есть вот такой интересный способ индексации аякса гуглом. Мы у себя используем — индексирует в лучшем виде.
                        +5
                        www.seoweblog.ru/archives/54 2006-й год. Уже 4 года назад поисковики кое-что понимали в Javascript.
                        +2
                        Гугл уже давно понимает javascript. Иначе зачем бы они писали предложения, как использовать аякс, чтоб гуглобот его понял.
                          0
                          Ну, этот пример скорее говорит об отсутствии необходимого уровня понимания гуглоботом javascript.

                          В своих предложениях по стандартизации навигации через хеши они предлагают конкретный универсальный способ делать из hash-location'а обычный query-location, чтобы их бот, безо всякой интерпретации javascript, увидев ссылку

                          http://example.com/page?query#!state

                          мог обратится по ссылке

                          http://example.com/page?query&_escaped_fragment_=state

                          и проиндексировать содержимое страницы, а в результатах поиска показывать все тот же http://example.com/page?query#!state.
                            +1
                            а бот его не понимает, для бота отдается статичная версия странички
                            +4
                            интересное словосочетание.
                            тектонические усилия
                            сеошники земную кору наверное двигать будут ^__^
                              0
                              Такая себе новость. Массу экспериментов на предмет взаимодействия поисковиков с JS проводили, например, Devaka в июне 2009-го. Общий вывод — да, парсят, просто тут солидный человек из самого Google подтвердил это официально.

                              Хотя взгляд сразу цепляется за слово «some» в ответе. Т.е. не всякий JS, так следует понимать?
                                0
                                > Devaka в июне 2009-го
                                404 Not Found
                                  0
                                  Хабразащита съела в ссылке в слове script. ручками URL поправьте.
                                    0
                                    букву съела :)
                                    0
                                    Не виноватый я, это habr. Когда пытаюсь вставить URL между тегами — habr коверкает в адресе ссылки слово «sсript» и посылает на 404. Вставлю без тегов, должно заработать — devaka.ru/articles/javascript-links-experiment
                                  0
                                  Вместо нативного Javascript можно использовать фреймворки, тогда, я думаю, бот ничего не поймет.
                                    0
                                    Зависит от того что они таки сделали. Может они сэндбокс на основе V8 замутили, хотя тогда some звучит как-то странно.
                                    –2
                                    Google уже flash сносно распознает. По крайней мере текст и ссылки. По ссылкам даже вес передает. Доказательство передачи веса — PR10 у страниц get.adobe.com/flashplayer/ и get.adobe.com/reader/, вшитых во все flash-баннеры (ссылки показываются пользователю, когда не установлен flashplayer).
                                      0
                                      Гугл (возможно, не всегда) исполняет яваскрипт на движке вебкита, по крайней мере у меня в логах были яваскрипт-ошибки из браузера на вебките с гугловского IP. При этом загружаются и стили, и картинки.
                                        0
                                        Было бы классно иметь возожность не волнуясь за находимость делать «сайты из одной страницы», т.е., так сказать, 100%-AJAX-сайты, где весь контент загружается с web-сервисов и презентуется javascript-ом в живом режиме.

                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                        Самое читаемое