iboobel5 июл 2013 в 10:24

Проверяйте ЧПУ

1 мин

23K

Веб-разработка *

-14

Комментарии 35

noonesshadow 5 июл 2013 в 10:26

ЧПУ, иронично но факт, делают не для людей, а для поисковых роботов. Еще не так давно наличие ключевых слов в URL влияло на позиции.

edogs 5 июл 2013 в 10:37

Да и сейчас влияет на самом деле.
Более того,
а) Если сквид не пропускает tits, то может проблема все же в сквид? Что за пуританство :D
б) Очень многим людям английский все же не знаком. И name-of-one-more-very-good-article не всегда людям понятнее чем Nazvanie-esche-odnoi-ochen-klassnoi-stati

mayorovp 5 июл 2013 в 10:45

По поводу второго пункта — уже много лет в URL можно использовать русские буквы, чем активно пользуется, например, Википедия.
Браузер сам сделает urldecode перед отображением пользователю, и urlencode перед отправкой на сервер.

Agent_J 5 июл 2013 в 10:53

При использовании кириллицы возникает проблема копипаста.
В итоге из урл такого вида
http://ru.wikipedia.org/wiki/Википедия: Алфавитный_указатель
мы получаем этот ужас
http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%90%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82%D0%BD%D1%8B%D0%B9_%D1%83%D0%BA%D0%B0%D0%B7%D0%B0%D1%82%D0%B5%D0%BB%D1%8C

lolmaus 5 июл 2013 в 11:08

Это косяк браузеров. Например, Opera (та, что на Presto) копирует такой адрес, не превращая его в кашу.

Haoose 5 июл 2013 в 11:56

Подсказка: копируйте не весь адрес, а, например, без первого символа. А первый допечатайте сами ;)

TsarS 5 июл 2013 в 12:21

Да лучше весь такой адрес от руки. Тренируй память!!!

andrewsh 5 июл 2013 в 14:10

Большой вопрос, что лучше. URL с процентами стопроцентно будет работать везде. Без них — как правило где-то символы от него отрываются автоматическими парсерами, потому как нету фиксированного алфавита, который закреплён только за урлами — парсерам сложнее детектить их границы. Потому я всегда копирую с процентами, да.

olen 5 июл 2013 в 11:36

К сожалению, не все браузеры показывают русские буквы в урле, некоторые отображают urlencode. Так делает, например, IE 10.

swanrnd 5 июл 2013 в 11:01

Длинные URL тоже не очень хорошо. Максимум 3-5 слов. Большее может идти во вред

НЛО прилетело и опубликовало эту надпись здесь

spmbt 5 июл 2013 в 12:14

Адрес вроде «example.com/proveryayte-chpu/» говорит куда больше о том, что скрывается за ссылкой, чем бездушный «habrahabr.ru/post/185684/».

Так же ж habrahabr.ru/post/185684/proveryayte-chpu ведёт куда надо. Как и такой

НЛО прилетело и опубликовало эту надпись здесь

isden 5 июл 2013 в 10:49

Ну так тот же гугл прямо рекомендует «Whenever possible, shorten URLs by trimming unnecessary parameters.», и что длинные и похожие URL ведут к снижению позиций.

maximw 5 июл 2013 в 10:53

Я думаю речь идет не о длине URL в байтах, а о количестве GET-параметров и, возможно, о количестве вложенности каталогов path.

«по возможности используйте слова, а не идентификаторы, состоящие из множества цифр»
support.google.com/webmasters/answer/76329

isden 5 июл 2013 в 10:57

Не только. Сравните, например:

example.com/o-saite/kontakty/otdel-prodaj.html

и

example.com/kontakty-otdel-prodaj.html

Во втором случае рейт ссылки будет чуть выше. Лично с похожим сталкивался у одного клиента (куча однотипных ссылок вида "/o-saite/..." и "/o-saite/kontakty/...").

maximw 5 июл 2013 в 11:01

Если взять две другие страницы:
example.com/kontakty-otdel-prodaj-telefon-i-vse-takoe.html
и
example.com/o-saite/kontakty/otdel-prodaj.html

Cкорее всего, у первой рейт будет выше, чем у второй. Дело не в длине URL, а в близости к корню сайта в структуре каталогов, что в URL называется path.

isden 5 июл 2013 в 11:04

А вот в этом случае — фиг его знает, точные правила ранжирования поисковиков — это та еще загадка.
Но я точно читал в рекомендациях, что нужно по возможности сокращать не только GET-часть, но и ЧПУ, оставляя там только релевантные странице данные.

lolmaus 5 июл 2013 в 11:07

> Но когда всякие модули «авто ЧПУ» делают что-то типа такого company.com/Nazvanie-esche-odnoi-ochen-klassnoi-stati … Тогда уж пусть будет так company.com/index.php?id=123.

Не согласен. Благодаря этому можно одним взглядом на ссылку понять, материал на какую тему по ней размещен.

А проблема длинного адреса решается так. Например, на StackOverflow:

stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project

Текст в ссылке можно отбросить (или даже поменять!), при этом ссылка продолжает указывать на тот же ресурс: stackoverflow.com/questions/17486877/

maximw 5 июл 2013 в 11:14

Я делаю ссылки вида example.com/[id]-[english-or-transliterated-title]

Запрашиваемый материал однозначно определяется [id]. При этом идет проверка, что если у этого материала, указанная в URL, текстовая часть, не соответствует актуальной, то делается 301-й редирект на полный URL с правильной текстовой частью, что помогает избежать дублирования страниц сайта для поисковиков.

ilyaerin 5 июл 2013 в 11:20

Еще можно использовать rel=”canonical” вместо 301 редиректа.

maximw 5 июл 2013 в 11:29

Можно, но rel=«canonical» не совсем то. Он говорит что у этой страницы есть похожие по содержанию. А 301-й редирект говорит что сама страница находится по другому адресу.
Мне кажется для конкретно этой цели лучше именно редирект, т.к.
— пользователь будет видеть у себя в браузере правильный URL, сможет, например, поставить закладку на него
— в поисковой выдаче скорее появится правильный URL (это не обоснованно, на уровне «чуйки»)
— и Гугл того же мнения: «A server-side 301 redirect is the best way to ensure that users and search engines are directed to the correct page.» (https://support.google.com/webmasters/answer/139066?hl=en#301)

ilyaerin 5 июл 2013 в 11:17

Это еще больший косяк. Поисковая система будет считать такие страницы дублями, что может плохо сказаться не только на этих страницах, но и на всем сайте.

newdya 5 июл 2013 в 11:20

    <link rel="canonical" href="http://stackoverflow.com/questions/17486877/how-can-i-use-google-play-services-in-a-maven-project">

ilyaerin 5 июл 2013 в 11:21

Ага, чуть выше я тож самое написал. Но самая по себе идея осознанного дублирования контента — плохая.

lolmaus 5 июл 2013 в 11:26

Это решается банальным 301 redirect со второстепенных адресов на канонический.

wronglink 5 июл 2013 в 11:59

[оффтоп]
Вообще-то, tits — это синички. Хотя, конечно, к ТИЦ они никакого отношения не имеют.

[/оффтоп]

Shark 5 июл 2013 в 12:04

Тема ТИЦ не раскрыта :)

НЛО прилетело и опубликовало эту надпись здесь

SidexQX 5 июл 2013 в 12:29

А СЕОшник молодец)))) Знает толк, как поднять в выдаче)

lenar 5 июл 2013 в 13:03

У казанского ЦУМа раньше был домен kazanCUM.ru. Естественно, самые инициативные рабочие прокси не пущали работников на такой сайт. :)
Еще похожая история была с одним сайтом, где фотографии девушек (безобидные, не эротика) лежали в папке girls — тоже резали прокси. :))

Anonym 6 июл 2013 в 08:32

Тут скорее проблема в вашем сквиде. Однажды столкнулся с похожей проблемой: сайт работал замечательно, но заказчик жаловался на какие-то странные глюки. Оказалось, что при сжатии JS сгенерированное имя файла содержало «sex» и выглядело как-то типа «5dyuu7trfikb7rf23isex7g62ir2i67rf2i3vi23.js», прокси у заказчика не пропускал этот файл. Ох и долго же мы искали в чем проблема.

empr 7 июл 2013 в 04:42

Забавно, что некоторые переводят SEF (search-engine friendly) URLs, как ЧПУ (человеку понятный URL), и наоборот.

pewpew 8 июл 2013 в 04:53

Проверяйте свой сквид. Зачем прятать tits?

iboobel 9 июл 2013 в 06:30

Мой сквид параноик, это я и сам знаю. Но дело не в сквиде. Попробуйте погуглить kontakty-TITS, там явно не туристический центр. И я не думаю что владельцы сайта очень ради таким ассоциациям.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий