Проверяйте ЧПУ

    Сейчас почти все заказчики сайтов указываю в требованиях к продукту «ЧПУ».
    ЧПУ — веб-адреса, удобные для восприятия человеком (а также систем и методов построения таких адресов). Является аббревиатурой от словосочетания «человекопонятный урл» (где «урл» — жаргонное обозначение URL) (википедия)


    Как пользователь я не очень вижу в них толк. Нет, если адреса такого вида company.com/downloads – тогда удобно и т. д… Но когда всякие модули «авто ЧПУ» делают что-то типа такого company.com/Nazvanie-esche-odnoi-ochen-klassnoi-stati … Тогда уж пусть будет так company.com/index.php?id=123.

    Это было высказывание личного мнения. А теперь про злую шутку которую сыграли авто-ЧПУ с одним сайтом.



    Есть организацияm, которая называется «Туристично-інформаційний центр» (Туристический информационный центр). У них есть некий сайт, и на сайте есть страница «Контакты ТИЦ», и как вы думаете авто ЧПУ решил эту задачу? Верно — «kontakty-TITS»! (Можно спросить у переводчика гугла что означают некоторые слова, если кто не понял). У меня сквид не захотел пропустить такую ссылку, вот я и начал разбираться почему.

    Вывод — проверяйте ЧПУ.

    Я помню читал какую-то айтишную статью, и там кто-то делясь опытом, советовал ни в коем случае не называть переменные в коде типа tovar или dostavka, а называть их на английском, по необходимости воспользоваться переводчиком. И перед остальными не так стыдно, и словарный запас пополнится.

    С ЧПУ я думаю нужно придерживаться такого же правила.
    Поделиться публикацией
    Комментарии 35
      +9
      ЧПУ, иронично но факт, делают не для людей, а для поисковых роботов. Еще не так давно наличие ключевых слов в URL влияло на позиции.
        +4
        Да и сейчас влияет на самом деле.
        Более того,
        а) Если сквид не пропускает tits, то может проблема все же в сквид? Что за пуританство :D
        б) Очень многим людям английский все же не знаком. И name-of-one-more-very-good-article не всегда людям понятнее чем Nazvanie-esche-odnoi-ochen-klassnoi-stati
          0
          По поводу второго пункта — уже много лет в URL можно использовать русские буквы, чем активно пользуется, например, Википедия.
          Браузер сам сделает urldecode перед отображением пользователю, и urlencode перед отправкой на сервер.
            +1
            При использовании кириллицы возникает проблема копипаста.
            В итоге из урл такого вида
            http://ru.wikipedia.org/wiki/Википедия: Алфавитный_указатель
            мы получаем этот ужас
            http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%90%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82%D0%BD%D1%8B%D0%B9_%D1%83%D0%BA%D0%B0%D0%B7%D0%B0%D1%82%D0%B5%D0%BB%D1%8C
              0
              Это косяк браузеров. Например, Opera (та, что на Presto) копирует такой адрес, не превращая его в кашу.
                +1
                Подсказка: копируйте не весь адрес, а, например, без первого символа. А первый допечатайте сами ;)
                  +2
                  Да лучше весь такой адрес от руки. Тренируй память!!!
                +2
                Большой вопрос, что лучше. URL с процентами стопроцентно будет работать везде. Без них — как правило где-то символы от него отрываются автоматическими парсерами, потому как нету фиксированного алфавита, который закреплён только за урлами — парсерам сложнее детектить их границы. Потому я всегда копирую с процентами, да.
                0
                К сожалению, не все браузеры показывают русские буквы в урле, некоторые отображают urlencode. Так делает, например, IE 10.
                +1
                Длинные URL тоже не очень хорошо. Максимум 3-5 слов. Большее может идти во вред
                +2
                Ну, почему? Адрес вроде «example.com/proveryayte-chpu/» говорит куда больше о том, что скрывается за ссылкой, чем бездушный «habrahabr.ru/post/185684/».
                  0
                  Адрес вроде «example.com/proveryayte-chpu/» говорит куда больше о том, что скрывается за ссылкой, чем бездушный «habrahabr.ru/post/185684/».

                  Так же ж habrahabr.ru/post/185684/proveryayte-chpu ведёт куда надо. Как и такой
                    0
                    Только таких нигде нет.
                +1
                Ну так тот же гугл прямо рекомендует «Whenever possible, shorten URLs by trimming unnecessary parameters.», и что длинные и похожие URL ведут к снижению позиций.
                  0
                  Я думаю речь идет не о длине URL в байтах, а о количестве GET-параметров и, возможно, о количестве вложенности каталогов path.

                  «по возможности используйте слова, а не идентификаторы, состоящие из множества цифр»
                  support.google.com/webmasters/answer/76329
                    0
                    Не только. Сравните, например:

                    example.com/o-saite/kontakty/otdel-prodaj.html

                    и

                    example.com/kontakty-otdel-prodaj.html

                    Во втором случае рейт ссылки будет чуть выше. Лично с похожим сталкивался у одного клиента (куча однотипных ссылок вида "/o-saite/..." и "/o-saite/kontakty/...").
                      0
                      Если взять две другие страницы:
                      example.com/kontakty-otdel-prodaj-telefon-i-vse-takoe.html
                      и
                      example.com/o-saite/kontakty/otdel-prodaj.html

                      Cкорее всего, у первой рейт будет выше, чем у второй. Дело не в длине URL, а в близости к корню сайта в структуре каталогов, что в URL называется path.

                        0
                        А вот в этом случае — фиг его знает, точные правила ранжирования поисковиков — это та еще загадка.
                        Но я точно читал в рекомендациях, что нужно по возможности сокращать не только GET-часть, но и ЧПУ, оставляя там только релевантные странице данные.
                  –1
                  > Но когда всякие модули «авто ЧПУ» делают что-то типа такого company.com/Nazvanie-esche-odnoi-ochen-klassnoi-stati … Тогда уж пусть будет так company.com/index.php?id=123.

                  Не согласен. Благодаря этому можно одним взглядом на ссылку понять, материал на какую тему по ней размещен.

                  А проблема длинного адреса решается так. Например, на StackOverflow:

                  stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project

                  Текст в ссылке можно отбросить (или даже поменять!), при этом ссылка продолжает указывать на тот же ресурс: stackoverflow.com/questions/17486877/
                    0
                    Я делаю ссылки вида example.com/[id]-[english-or-transliterated-title]

                    Запрашиваемый материал однозначно определяется [id]. При этом идет проверка, что если у этого материала, указанная в URL, текстовая часть, не соответствует актуальной, то делается 301-й редирект на полный URL с правильной текстовой частью, что помогает избежать дублирования страниц сайта для поисковиков.
                      –1
                      Еще можно использовать rel=”canonical” вместо 301 редиректа.
                        +3
                        Можно, но rel=«canonical» не совсем то. Он говорит что у этой страницы есть похожие по содержанию. А 301-й редирект говорит что сама страница находится по другому адресу.
                        Мне кажется для конкретно этой цели лучше именно редирект, т.к.
                        — пользователь будет видеть у себя в браузере правильный URL, сможет, например, поставить закладку на него
                        — в поисковой выдаче скорее появится правильный URL (это не обоснованно, на уровне «чуйки»)
                        — и Гугл того же мнения: «A server-side 301 redirect is the best way to ensure that users and search engines are directed to the correct page.» (https://support.google.com/webmasters/answer/139066?hl=en#301)
                      –1
                      Это еще больший косяк. Поисковая система будет считать такие страницы дублями, что может плохо сказаться не только на этих страницах, но и на всем сайте.
                        0
                            <link rel="canonical" href="http://stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project">
                        
                          –1
                          Ага, чуть выше я тож самое написал. Но самая по себе идея осознанного дублирования контента — плохая.
                          0
                          Это решается банальным 301 redirect со второстепенных адресов на канонический.
                        +13
                        [оффтоп]
                        Вообще-то, tits — это синички. Хотя, конечно, к ТИЦ они никакого отношения не имеют.
                        image
                        [/оффтоп]
                          +4
                          Тема ТИЦ не раскрыта :)
                          • НЛО прилетело и опубликовало эту надпись здесь
                              –2
                              А СЕОшник молодец)))) Знает толк, как поднять в выдаче)
                                +1
                                У казанского ЦУМа раньше был домен kazanCUM.ru. Естественно, самые инициативные рабочие прокси не пущали работников на такой сайт. :)
                                Еще похожая история была с одним сайтом, где фотографии девушек (безобидные, не эротика) лежали в папке girls — тоже резали прокси. :))
                                  +2
                                  Тут скорее проблема в вашем сквиде. Однажды столкнулся с похожей проблемой: сайт работал замечательно, но заказчик жаловался на какие-то странные глюки. Оказалось, что при сжатии JS сгенерированное имя файла содержало «sex» и выглядело как-то типа «5dyuu7trfikb7rf23isex7g62ir2i67rf2i3vi23.js», прокси у заказчика не пропускал этот файл. Ох и долго же мы искали в чем проблема.
                                    0
                                    Забавно, что некоторые переводят SEF (search-engine friendly) URLs, как ЧПУ (человеку понятный URL), и наоборот.
                                      +1
                                      Проверяйте свой сквид. Зачем прятать tits?
                                        +1
                                        Мой сквид параноик, это я и сам знаю. Но дело не в сквиде. Попробуйте погуглить kontakty-TITS, там явно не туристический центр. И я не думаю что владельцы сайта очень ради таким ассоциациям.

                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                        Самое читаемое