2 месяца назад.
Но дело не в этом. Был официальный ответ яндекса на этот вопрос. Т.е. это не мое предположение, это факт. Принципиальный. Печальный. Непонятный.
Да, действительно, картинки, которые доступны только по https, не индексируются. Мы планируем это исправить в будущем, но нужно понимать, что пока таких сайтов очень мало, поэтому у этой задачи не самый высокий приоритет в наших планах. Важно отметить, что картинки со страниц, доступных только по https, индексируются, если сами картинки при этом открыты и по http. И сами сайты, доступные только по https, тоже индексируются.
А что если открыть картинки для http, скормить их роботу под соусом sitemap-image, но при этом ссылки не менять на страницах, оставить везде img src=https.
Будут ли они ранжироваться как надо? ссылочный вес и т.п.?
Спасибо. Т.е. если я в правилах nginx укажу не ставить редирект с http на https для картинок, то робот, найдя src картинки с https «попробует» её и по хттп, и если найдет — проиндексирует?
И все-таки не пойму, как тут может быть невысокий приоритет. Изображения — часть контента.
Фактически выходит, что яндекс индексирует в 2 раза меньше полезной информации с ресурсов, доверять которым можно в 2 раза больше.
Ставит под сомнение качество выдачи.
Позволит украсть картинки с https ресурсов владельцам http ресурсов и выдать за свои.
Считаю, что данный нюанс индексации посредством оставления «норок» по http должен быть тут (http://help.yandex.ru/images/indexing.xml) однозначно.
Да я боюсь ответ один — в косности Яндекса в данном случае и в четком непонимании проблем пользовавтелей.
Я не спец по поиску, конечно, и вообже живу в другой сфере (хостинг), но даже со своей недалекой колокольни могу сказать, что https/spdy 1,2,3/sni должны СРАЗУ же поддерживаться поисковиками, а уже потом должны подтягиваться кастомеры. Ибо это натуральное неприкрытое торможение или даже саботирование технологического прогресса.
Сайт без https и БЕЗ http версии (либо в виде редирект на https) — это вполне себе реальная ситуация. А проблема с тем, что картинки с https сайты нельзя из-за варнингов (постойте, какие нафиг варнинги браузеров для EV?!) решается тем же гуглом что они фигачат картинку прямо в код в base64 :)
Алсо, отсутствие оперативной реакции от Яндекса в виде «Вот это у нас косяк, спасибр, завтра починим» — ОГРОМНЫЙ минус им в карму. Даже больший, чем их уродский вертикальный баннер в левой части экрана.
Документация скоро будет. Не волнуйтесь! Этот вопрос, безусловно важный, но в выходные ради него решили всё-таки на работу не выходить ;). А вообще — спасибо за напоминание!
Персонализированный www.amazon.com/gp/yourstore (туда перекидывает после влогинивания) — https-only, обычный корневой amazon.com — продолжает быть http-only.
не настраивался, так как TLS домен всего 1.
Но эт не важно же.
Важно, что картинка с адресом https://site.com/img.jpg не будет проиндексирована яндексом и не попадет в поиск по яндекс.картинкам
Что вы имеете в виду? Как я понял из статьи, используется nginx в качестве фронт-энда, а в nginx заменить http на https или наоборот не составит труда. В каком режиме работает фронт-энд, не влияет на логику сайта (бек-энд).
Можно представителям Яндекса напрямую писать в личные сообщения на хабре, их найти тут дело 10 минут. Можно писать им просто в саппорт, можно писать платонам, можно писать по контактным данным сотни всяких представителей, выступавших на конференциях, можно писать через яндекс-вебмастер, можно спросить на серче. Яндекс — не Google, вариантов с ним связаться и открыто поговорить — масса. И с ними можно конструктивно решать вопросы и я знаю это на личном опыте. А таких записей как выше про каждую крупную компанию можно настрогать несколько десятков, никто не идеален.
А если целью поста было не решение проблемы автора, а привлечение внимания общественности к этому вопросу и поднятие шума с целью влияния на скорость работ Яндекса в этом направлении, то можно было хотя-бы оформить это иначе.
Если хотелось сделать полезное дело и подсказать людям решение проблемы — можно было таки написать в техподдержку/представителям и получить нормальный ответ и потом выложить на хабр готовое решение.
Целью поста было:
1 — решение проблемы автора
2 — привлечение внимания общественности
3 — поднятие шума с целью влияния на скорость работ Яндекса в этом направлении
4 — хотелось сделать полезное дело и подсказать людям решение проблемы
Не вижу диссонанса с манерой оформления поста.
Просто сам факт такого поверг лично меня почти что в шок.
А я был почти в шоке, когда оказалось, что между последними iPhone и MacBook Pro Retina про нельзя кидать файлы по AirDrop. Я до сих пор почти в шоке от юзабилити интерфейсов Google для вебмастеров и рекламодателей (контраст с Яндексом) и от того, что в AdSense нельзя посмотреть доходы с разных каналов youtube. Я каждый день в шоке от работы всех государственных служб, в шоке от новых законов «про интернет» в РФ и еще немного в шоке от недавних событий в своей стране. Да что уж там, этот мир вообще еще может удивлять.
К вам лично претензий нет. Был вопрос, вопрос исчерпан.
Есть теперь вопрос к минусяторам — вы не смогли понять смысл моего вопроса и вам необходимо было развернутое объяснение довольно очевидной фразы в несколько слов или хабр перестал быть ресурсом для здравомыслящих и теперь в тренде не аргументированные отверы/критика/комментарии/пояснения, а немое жмякание кнопок? Как-то это не серьезно.
Да порой мне кажется что Яндекс живет своей жизнью, а интернет, своей… Но кто от этого больше страдает? Я просто не понимаю политики Яндекса в таких вопросах. Вот например около трех лет назад с развитием HTML5 все сайты начали переходить на SEO friendly and accessible url, No more #! Ну а раз сам Google отказался от #! то и индексирует одностраничные приложения без #! замечательно, без проблем, как разумеется и Bing и прочие… Годы идут, для современного мира и тем более интернета три года — это огромный срок, но Яндекс твердо стоит на своем давно устаревшем стандарте. Яндекс не собирается индексировать ваши одностраничные сайты без #!.. Вот только хочу понять как они это обосновывают для себя? Религия не позволяет что ли учитывать новые стандарты? Или позволяет, но на это у Яндекса уйдут десятилетия? Интернету что ли хуже от этого или Яндексу, что он не индексирует?
В общем, можете считать официальным комментарием ;).
Для того, чтобы картинки индексировались, нужно, чтобы робот мог их скачать по http. При этом, очевидно, не нужно нарушать целостность https и класть на страницу картинки с незащищёнными http урлами. Ссылка на https картинку нормально обработается и сохранится у нас в базе. Когда придёт время, робот пойдёт качать картинку с этим же урлом, используя http протокол.
Добавили абзац в документацию. Спасибо за обратную связь ;)
Слушайте, а можете пояснить, почему так получилось?
Паук использует какую-то совсем свою, самописную, имплементацию протокола — и в ней только голому http место нашлось, без s?
Нет, оно понятно, — то, что исторически сложилось и обросло кучей всего другого менять очень сложно.
Но, как то вот, именно в этом случае — совсем не правильно.
Может подвинете таску как-то повыше что-ли, в приоритете то.
Логика ведь сама подсказывает — сайты, могущие себе позволить SSL / EV SLL, с большей вероятностью могут себе позволить и более качественные, авторские работы.
Отлично. Минуло 3 недели, а воз и ныне там. Скоростной робот то, блин.
Этот жестокий, жестокий мир.
Можно узнать, как часто картиночный бот кушает джпеги?
Или может они недостаточно приправлены exif 'ами?
Или микроформаты ему не угодили?
А может быть потому, что на картинках нет котят >^'.'^<?
Яндекс не индексирует изображения с сайтов под https