Как стать автором
Обновить

Комментарии 35

ЧПУ, иронично но факт, делают не для людей, а для поисковых роботов. Еще не так давно наличие ключевых слов в URL влияло на позиции.
Да и сейчас влияет на самом деле.
Более того,
а) Если сквид не пропускает tits, то может проблема все же в сквид? Что за пуританство :D
б) Очень многим людям английский все же не знаком. И name-of-one-more-very-good-article не всегда людям понятнее чем Nazvanie-esche-odnoi-ochen-klassnoi-stati
По поводу второго пункта — уже много лет в URL можно использовать русские буквы, чем активно пользуется, например, Википедия.
Браузер сам сделает urldecode перед отображением пользователю, и urlencode перед отправкой на сервер.
При использовании кириллицы возникает проблема копипаста.
В итоге из урл такого вида
http://ru.wikipedia.org/wiki/Википедия: Алфавитный_указатель
мы получаем этот ужас
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%90%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82%D0%BD%D1%8B%D0%B9_%D1%83%D0%BA%D0%B0%D0%B7%D0%B0%D1%82%D0%B5%D0%BB%D1%8C
Это косяк браузеров. Например, Opera (та, что на Presto) копирует такой адрес, не превращая его в кашу.
Подсказка: копируйте не весь адрес, а, например, без первого символа. А первый допечатайте сами ;)
Да лучше весь такой адрес от руки. Тренируй память!!!
Большой вопрос, что лучше. URL с процентами стопроцентно будет работать везде. Без них — как правило где-то символы от него отрываются автоматическими парсерами, потому как нету фиксированного алфавита, который закреплён только за урлами — парсерам сложнее детектить их границы. Потому я всегда копирую с процентами, да.
К сожалению, не все браузеры показывают русские буквы в урле, некоторые отображают urlencode. Так делает, например, IE 10.
Длинные URL тоже не очень хорошо. Максимум 3-5 слов. Большее может идти во вред
НЛО прилетело и опубликовало эту надпись здесь
Адрес вроде «example.com/proveryayte-chpu/» говорит куда больше о том, что скрывается за ссылкой, чем бездушный «habrahabr.ru/post/185684/».

Так же ж habrahabr.ru/post/185684/proveryayte-chpu ведёт куда надо. Как и такой
НЛО прилетело и опубликовало эту надпись здесь
Ну так тот же гугл прямо рекомендует «Whenever possible, shorten URLs by trimming unnecessary parameters.», и что длинные и похожие URL ведут к снижению позиций.
Я думаю речь идет не о длине URL в байтах, а о количестве GET-параметров и, возможно, о количестве вложенности каталогов path.

«по возможности используйте слова, а не идентификаторы, состоящие из множества цифр»
support.google.com/webmasters/answer/76329
Не только. Сравните, например:

example.com/o-saite/kontakty/otdel-prodaj.html

и

example.com/kontakty-otdel-prodaj.html

Во втором случае рейт ссылки будет чуть выше. Лично с похожим сталкивался у одного клиента (куча однотипных ссылок вида "/o-saite/..." и "/o-saite/kontakty/...").
Если взять две другие страницы:
example.com/kontakty-otdel-prodaj-telefon-i-vse-takoe.html
и
example.com/o-saite/kontakty/otdel-prodaj.html

Cкорее всего, у первой рейт будет выше, чем у второй. Дело не в длине URL, а в близости к корню сайта в структуре каталогов, что в URL называется path.

А вот в этом случае — фиг его знает, точные правила ранжирования поисковиков — это та еще загадка.
Но я точно читал в рекомендациях, что нужно по возможности сокращать не только GET-часть, но и ЧПУ, оставляя там только релевантные странице данные.
> Но когда всякие модули «авто ЧПУ» делают что-то типа такого company.com/Nazvanie-esche-odnoi-ochen-klassnoi-stati … Тогда уж пусть будет так company.com/index.php?id=123.

Не согласен. Благодаря этому можно одним взглядом на ссылку понять, материал на какую тему по ней размещен.

А проблема длинного адреса решается так. Например, на StackOverflow:

stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project

Текст в ссылке можно отбросить (или даже поменять!), при этом ссылка продолжает указывать на тот же ресурс: stackoverflow.com/questions/17486877/
Я делаю ссылки вида example.com/[id]-[english-or-transliterated-title]

Запрашиваемый материал однозначно определяется [id]. При этом идет проверка, что если у этого материала, указанная в URL, текстовая часть, не соответствует актуальной, то делается 301-й редирект на полный URL с правильной текстовой частью, что помогает избежать дублирования страниц сайта для поисковиков.
Еще можно использовать rel=”canonical” вместо 301 редиректа.
Можно, но rel=«canonical» не совсем то. Он говорит что у этой страницы есть похожие по содержанию. А 301-й редирект говорит что сама страница находится по другому адресу.
Мне кажется для конкретно этой цели лучше именно редирект, т.к.
— пользователь будет видеть у себя в браузере правильный URL, сможет, например, поставить закладку на него
— в поисковой выдаче скорее появится правильный URL (это не обоснованно, на уровне «чуйки»)
— и Гугл того же мнения: «A server-side 301 redirect is the best way to ensure that users and search engines are directed to the correct page.» (https://support.google.com/webmasters/answer/139066?hl=en#301)
Это еще больший косяк. Поисковая система будет считать такие страницы дублями, что может плохо сказаться не только на этих страницах, но и на всем сайте.
    <link rel="canonical" href="http://stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project">
Ага, чуть выше я тож самое написал. Но самая по себе идея осознанного дублирования контента — плохая.
Это решается банальным 301 redirect со второстепенных адресов на канонический.
[оффтоп]
Вообще-то, tits — это синички. Хотя, конечно, к ТИЦ они никакого отношения не имеют.
image
[/оффтоп]
Тема ТИЦ не раскрыта :)
НЛО прилетело и опубликовало эту надпись здесь
А СЕОшник молодец)))) Знает толк, как поднять в выдаче)
У казанского ЦУМа раньше был домен kazanCUM.ru. Естественно, самые инициативные рабочие прокси не пущали работников на такой сайт. :)
Еще похожая история была с одним сайтом, где фотографии девушек (безобидные, не эротика) лежали в папке girls — тоже резали прокси. :))
Тут скорее проблема в вашем сквиде. Однажды столкнулся с похожей проблемой: сайт работал замечательно, но заказчик жаловался на какие-то странные глюки. Оказалось, что при сжатии JS сгенерированное имя файла содержало «sex» и выглядело как-то типа «5dyuu7trfikb7rf23isex7g62ir2i67rf2i3vi23.js», прокси у заказчика не пропускал этот файл. Ох и долго же мы искали в чем проблема.
Забавно, что некоторые переводят SEF (search-engine friendly) URLs, как ЧПУ (человеку понятный URL), и наоборот.
Проверяйте свой сквид. Зачем прятать tits?
Мой сквид параноик, это я и сам знаю. Но дело не в сквиде. Попробуйте погуглить kontakty-TITS, там явно не туристический центр. И я не думаю что владельцы сайта очень ради таким ассоциациям.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории