company_banner

Отслеживание ошибок, поисковая оптимизация и анализ сайтов на качество разметки и скорость страниц

    Легко следить за качеством разметки, поисковой оптимизацией и производительностью на небольшом сайте, где вы точно уверены какой блок разметки каким кодом генерируется. Сложнее становится, когда ваш сайт разрастается и код начинает генерироваться с помощью элементов управления, мастер-страниц, шаблонов, CMS и другими автоматическими способами.

    Тут-то и появляется нужда в хорошем автоматическом инструменте, который мог бы пробежаться по всем страницам сайта, обнаружить потенциальные проблемы в коде и верстке, оценить производительность страниц, их насыщенность графическими материалами, ссылками и так далее.

    clip_image001
    Рис.1. Главное окно SEO Toolkit

    В этой статье попробуем провести такой анализ на примере одного из самых известных сайтов рунета artlebedev.ru с помощью бесплатного инструмента Search Engine Optimization Toolkit.

    Search Engine Optimization Toolkit


    Если мы запустим SEO Toolkit из панели IIS Manager, то увидим следующее окно (рисунок 1) с помощью которого мы сможем получить доступ к разным функциональным частям инструмента: анализу сайта на проблемы, работе с картами сайтов и работе с файлами типа robots.txt.

    Самое интересно для нас содержится в анализе сайта на проблемы. Запустить новый анализ можно нажав соответствующую ссылку "Create a new analysis". Появится диалоговое окно, которое позволит нам тонко настроить сайта (рисунок 2). По умолчанию, мы можем задать имя сайта и его адрес и сразу же запустить анализ на выполнение, но интереснее будет настроить некоторые параметры. Для доступа к ним нужно развернуть свернутую панель Advanced Settings.

    clip_image002
    Рис.2. Настройка анализа сайта

    Здесь мы можем указать такие важные параметры как:
    • Максимальное число URL для анализа с сайта, так как крупные сайты могу содержать большое число URL имеет смысл это число ограничить
    • Максимальный размер URL для анализа
    • Игнорировать или нет атрибут nofollow и метатег noindex
    • Сохранять загруженные страницы и контент на диске для быстрого к ним доступа
    • Что считать внутренними ссылками
    • Аутентификацию, если ресурс ее требует

    Как видим эти параметры могут сильно повлиять на глубину анализа и число проанализированных страниц необходимого нам сайта. Для нашего анализа установим число URL в 1000.

    Анализ сайта


    После запуска анализа может пройти некоторое время, пока все необходимые данные будут получены с удаленного ресурса (рисунок 3). Время необходимое на анализ напрямую зависит от параметров, которые вы задали и больше всего от максимального числа загружаемых URL (если, конечно сайт на самом деле содержит столько страниц).

    clip_image003
    Рис.3. Анализ сайта

    Я указал 1000 страниц и анализ не затянулся надолго. После его завершения SEO Toolkit предложит массу отчетов и статистической информации доступной в удобном виде. Давайте посмотрим, что можно из этих отчетов узнать (рисунок 4).

    clip_image004
    Рис.4. Отчеты по сайту

    Итак, наш поверхностный анализ 1000 первых страниц сайта обнаружил около 65000 ссылок на них и чуть более 9000 нарушений правил и следовательно потенциальных проблем.

    Тут нужно остановиться и пояснить, что не каждое обнаруженное нарушение может считаться настоящей проблемой, в конце концов сайт artlebedev.ru не первый год функционирует несмотря на все эти нарушения. Однако, нам будет интересно узнать в чем же они заключаются.

    Для анализа у нас есть четыре вкладки: Violations (нарушения), Content, Performance и Links. Каждый из этих разделов содержит массу полезной информации о анализируемом ресурсе.

    Анализ нарушений


    Перейдем в первую вкладку Violations, где для нас сразу же будет выведен полный список типов нарушений обнаруженных на страницах сайта (рисунок 5).

    clip_image005
    Рис. 5. Типы нарушений обнаруженные на страницах

    Итак, что же за нарушения мы обнаружили. Остановимся на некоторых и з них, как самых интересных, хотя вы можете вдумчиво исследовать каждое из них и позднее адресовать эти проблемы, что бы избавится от потенциальных проблем.

    Страница содержит ненужные редиректы

    Если перейти на детали этого нарушения (двойной щелчок), то мы увидим все найденные ресурсы, где как предполагается существует лишний(е) редиректы (рисунок 6).

    clip_image006
    Рис.6. Отчет о ненужных редиректах

    Широко известно, что уменьшение редиректов положительно сказывается на скорости загрузки страницы, однако порой они необходимы. В любом случае, SEO Toolkit позволит вам держать ситуацию под контролем и наблюдать за всеми редиректами, быстро обнаруживая ненужные.

    Обратите внимание на окно с отчетом о найденных ошибках. Сверху вы видите полный список всех URL, которые содержат данную проблему. Снизу расположено большое число вкладок, которые позволят вам очень подробно изучить проблему:

    Details содержит базовую информацию о странице, где найдена проблема

    clip_image007
    Рис.7. Вкладка Details

    Violation (Нарушение) содержит подробное описание проблемы с краткой информацией о том, почему это важно.

    clip_image008
    Рис.8. Вкладка Violation

    Headers содержит информацию о полученных HTTP-заголовках

    clip_image009
    Рис.9. Вкладка Headers

    Content содержит полный текст полученный в рез ультате запроса к URL. При этом, нарушение, которое мы сейчас изучаем, будет специально выделено, для быстрого поиска.

    clip_image010
    Рис.10. Вкладка Content

    На Word Analisys стоит остановиться подробнее. Эта вкладка содержит информацию о тексте и повторении тех или иных слов на странице сайта. Вы сможете быстро узнать сколько у вас повторений слов, сколько повторений фраз из двух и трех слов. Ну и получить чистый текст страницы очищенный от тегов. Информации много, есть над чем подумать в плане SEO.

    clip_image011
    Рис.11. Вкладка Word Analysis

    Вкладка Links содержит информацию о страницах, которые ссылаются на эту страницу и наоборот, о ссылках на другие страницы, обнаруженные на этой странице.

    clip_image012
    Рис.12. Вкладка Links

    И наконец, вкладка Violations содержит полный список всех нарушений обнаруженных на этой странице. Вы можете перейти к каждой из них и начать анализировать отдельно.

    clip_image013
    Рис.13. Вкладка Violations

    Итак, с помощью изучения нарушения через подробную информацию мы можем найти конкретное место, где это нарушение находится и принять решение следует или нет нам это нарушение о редиректах исправлять.

    Обнаружены ошибки в разметке

    Наш анализ обнаружил множество страниц с ошибками в разметке. Большей частью это ошибки связанные с тегами, например:

    The page at "www.artlebedev.ru/studio" contains invalid markup.

    Tag: 'a' was not opened correctly.


    The page at "www.artlebedev.ru/everything" contains invalid markup.

    The Tag 'div' was not closed correctly, the Tag 'body' was closed instead.


    The page at "www.artlebedev.ru/everything/kopilkus" contains invalid markup.

    The Tag 'div' was not closed correctly, the Tag 'td' was closed instead.


    И так далее. Насколько эти нарушение важны решать только вам. SEO Toolkit просто будет держать вас в курсе.

    Страница содержит большой кусок встроенного CSS-кода

    Хотя встраивать CSS в разметку допустимо, хорошим тоном является вынесение стилей в отдельный файл. Наш анализ обнаружил несколько страниц с большими кусками CSS-кода встроенного в страницу (рисунок 14).

    clip_image014
    Рис.14. Информация об ошибке

    Перейдя на вкладку Content мы можем посмотреть, что же это за код (рисунок 15).

    clip_image015
    Рис.15. Контент связанный с ошибкой

    Мы рассмотрели некоторые из найденных ошибок и то, как эти ошибки могут анализироваться. Ниже список других ошибок обнаруженных при анализе:
    • Тег img не содержит атрибут alt
    • Метатег description пропущен
    • Страница содержит несколько тегов H1
    • Тег H1 пропущен (но обнаружены теги H2-H6)
    • Заголовок слишком большой
    • Неверные ссылки на странице (возвращают 404 или другие ошибки)
    • Заголовок слишком маленький
    • На странице обнаружено несколько тегов title
    • В теле гиперссылки содержится неверный URL
    • Title пустой
    • При запросе к URL произошла ошибка

    Все эти нарушения потенциально могут так или иначе влиять на ваш проект: на поисковую выдачу, на скорость работы сайта, на доступность пользователю. Стоит или нет адресовать эти проблемы решать только вам, важно что вы про них теперь знаете.

    Другими полезными вкладками при работе с нарушениями являются:

    Pages with Most Violations (страницы с наибольшим числом нарушений)

    clip_image016
    Рис.16. Most Violations

    Категории обнаруженных нарушений

    clip_image017
    Рис.17. Категории нарушений

    Уровни обнаруженных нарушений

    clip_image018
    Рис.18. Уровни нарушений

    Раздел Content


    Поработав с результатами анализа сайта на нарушения, мы можем получить еще больше аналитической информации в разделе Content. Здесь представлен целый набор разрезов данных для вашей информации:

    clip_image019
    Рис.19. Разрезы раздела Content

    Например, все страницы с ошибочными ссылками:

    clip_image020
    Рис.20. Все страницы с ошибочными ссылками

    Или страницы с одинаковыми заголовками

    clip_image021
    Рис.21. Страницы с одинаковыми заголовками

    По каждому из параметров можно получить подробную информацию.

    Вкладка Performance


    Очень полезный функционал SEO Toolkit, который позволит вам оценить производительность страниц вашего сайта, время, которое потребуется пользователю чтобы загрузить страницу (рисунок 22)

    clip_image022
    Рис.22. Список наиболее тяжелых страниц

    Другая вкладка этого раздела позволит вам увидеть страницы с самым большим числом ресурсов (рисунок 23)

    clip_image023
    Рис.23. Список страниц с наибольшим числом ресурсов

    На каждый элемент списка можно перейти и проанализировать его более подробно. Как мы видим, некоторые страницы очень тяжелые и вы можете адресовать эту проблему тем или иным способом, чтобы улучшить впечатление пользователей от вашего ресурса.

    Раздел Links


    Последний из разделов SEO Toolkit позволяет проанализировать контент сайта со стороны ссылок. Например, увидеть страницы с самым большим числом ссылок (рисунок 24)

    clip_image024
    Рис.24. Контент связанный с ошибкой

    Отчеты и запросы

    Последний функционал SEO Toolkit, который я хотел бы рассмотреть — это построение отчетов и запросов к аналитической информации. С помощью специальных инструментов вы можете гибко выбирать именно те данные, которые вам нужны:

    clip_image025
    Рис.25. Отчеты и запросы

    Результаты отчета можно экспортировать во внешний файл или сохранить запрос для повторного исполнения.

    Загрузки


    После написания статьи понял, что совсем забыл рассказать про то, где и как установить SEO Toolkit.

    SEO Toolkit разработан Microsoft для сервера IIS, загрузить этот бесплатный компонент можно по следующей ссылке:

    http://www.iis.net/download/SEOToolkit

    На этой же странице можно получить больше информации о инструменте.

    Заключение


    В этой статье я хотел рассказать о некоторых возможностях бесплатного инструмента SEO Toolkit, который позволит вам проанализировать ваши сайты на потенциальные проблемы и получить гору аналитической информации по коду и производительности ваших страниц.

    Надеюсь, этот инструмент сослужит вам хорошую службу. Пусть веб будет красивым и быстрым.
    Microsoft
    494,00
    Microsoft — мировой лидер в области ПО и ИТ-услуг
    Поделиться публикацией

    Комментарии 10

      +1
      Увидел «производительность» и «качество», зашел, а тут СЕО =(
        0
        немного изменил название, прошу прощения если ввел в заблуждение
          0
          да нет, это не претензия, просто поделился =)
            0
            и скорость тогда уж убрать, а то я прямо напрягся весь :)
          0
          А почему http://microsoft.com в качестве подопытного не взяли?
            +4
            Никто не знает, как он выглядит.
            +1
            А почему у всех ваших картинок выключено кеширование?
            Cache-Control: no-cache
            

            Загружать по полмегабайта с прямо скажем не самого быстрого сервера весьма неприятно. Кэп просто настойчиво говорит, что есть habrastorage.org.
              0
              а может кто-то подскажет похожий, аналогичный софт под мак?
                0
                Присоединяюсь к вопросу.
                0
                Спасибо. Правда у меня большинство ошибок не ошибки. Сторонние сервисы по поиску 404 ошибок и прочего работают, как мне кажется более корректно. Но на стороне этого — скорость и объем информации и удобство. Буду стараться адаптировать под себя.

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое