Pull to refresh

Comments 19

Про Яндекс новости вы слишком мягко описали. Там rss еще нужно отдавать в нужном им формате, нам приходилось делать другую отдачу и помещать данные в отдельные теги. В тексте новости не должно быть указания автора, так как автор должен быть вынесен в отдельное поле в ленте.
2.‭ ‬Специальный элемент для экспорта полного текста сообщений

Кроме стандартных элементов RSS‭ ‬2.0,‭ ‬для экспорта Данных используется специальный элемент‭ ‬,‭ ‬который должен содержать полный текст сообщения.‭ ‬Этот элемент является обязательным.‭ ‬Полный текст сообщения необходим для индексирования поисковым роботом и на Яндекс.ру не размещается.‭ ‬В полном тексте‭ ‬не должны содержаться название источника и дата/время сообщения,‭ ‬а также контактная информация и любая другая информация,‭ ‬которая повторяется в каждом сообщении.‭

Это только начало ) Требования Яндекса к формату можно вот тут почитать
drupalcookbook.ru/sites/default/files/yandex-rss-tech.rtf
Именно так, я несколько дополнил статью в разделе про Яндекс.Новости. Официальные технические требования с примерами опубликованы здесь: partner.news.yandex.ru/tech.pdf
я без сарказма спросил, действительно интересно.
спасибо за ответы.
Я специально не коснулся технических вопросов подготовки RSS для Яндекс.Новостей в статье.
Для них мы тоже дорабатывали канал, формат можно посмотреть: www.komtet.ru/rss_tech — именно он и используется Яндекс.Новостями. Кстати, тот же канал использует и Рамблер.
Для CMS Magazine собирается свой www.komtet.ru/rss_cms (только по CMS).
Проблемы с технической стороны были, мы получили замечание от Яндекс.Новости, что <yandex:full-text> должен содержать полный текст сообщения, у нас сначала тег <yandex:full-text> не содержал первый абзац новости.
Несколько дополнил описание, спасибо за пожелание.
Мои извинения за некоторую дезинформацию. Канал для Яндекс.Новостей тот же (по содержанию), только вот им передаётся в изменённом формате: www.komtet.ru/rss_yandex
Спасибо за статью, полезная информация.
Да, такой же негативный опыт общения с Гуглом по этому вопросу.

Относительно Яндекса — обработка запроса может занять около недели. Потом еще несколько дней верификации вашей RSS (в формате Яндекс.XML).
Вероятно, мне просто повезло. Отвечали быстро, вся процедура исправления и проверки заняла меньше недели.
На сайте Google потом встречал информацию, что они пока не принимают новости в RSS и Atom. Их сотрудники мне отказали по другим причинам.
Я неоднократно проходил процедуру Яндекса для разных изданий, раз 5, наверное. Времени всегда разного требует, неделя — это максимум, который был.
У Rambler-Новостей буквально недавно обновились (я бы сказал, упорядочились) условия для источников. По крайней мере поток, состоящий целиком из перепечаток, они теперь могут отвергнуть. Перед этим событием нашу ленту сначала из новостей выкинули, потом (после повторной отправки заявки с разъяснениями, что у нас в RSS перепечатки принципиально не попадают) снова вернули.

Google любит, чтобы источник был «серьезным» — хорошо выглядел и за ним стояли реальные постоянно работающие сотрудники. Это следует отражать в заявке. Хорошая страница «об издании» на сайте должна помочь в приеме заявки. В статье не указано, что Google не имеет дела с RSS, он сканирует новостные страницы напрямую, не всегда быстро и корректно, может захватить со страниц лишнее или не взять нужное.

Из других аггрегаторов от крупных порталов я бы еще упомянул сравнительно новые Новости.LiveInternet. Попасть туда с хорошей лентой новостей просто.

Из опыта: я бы советовал каждому аггрегатору давать отдельный адрес RSS-потока, так проще и следить за обращениями, и тонко настраивать выдачу, и ограничивать доступ по мере надобности. По крайней мере мне это проще, чем следить за user-agent'ами.
1. Rambler пока в своих правилах пишет, что дублированные новости допускаются. Разумеется, они оставляют за собой право отказать в трансляции «если 80% новостей не является уникальным контентом» (ссылка на правила в статье). Видимо на практике не совсем так.
2. Я даже не знаю, как подступиться к Google. Писал, что над созданием уникального контента новостей работает редактор (он же корректор), профессиональный переводчик и технические специалисты компании (это правда). Ранее в комментариях я упомянул, что с RSS и Atom Google не работают. Вы правы, надо это вынести в текст статьи, спасибо! Если позволите, то добавлю и Вашу рекомендацию, относительно страницы «об издании». Ну и такую статью опубликую, чуть позже попробую ещё раз.
3. Отправил запрос на Новости.LI. Допишу в статье.
4. Согласен, должно быть несколько тематических каналов, об этом тоже упомянуто в комментариях, но так же стоит вынести в текст статьи.
Спасибо за такой развёрнутый комментарий!
Мне кажется, большинство Ваших проблем с (не)попаданием в те или иные новостные агрегаторы могут быть связаны с тем, что последние хотят видеть среди источников только сайты, явно являющиеся СМИ. Новости, публикуемые на корпоративных сайтах, — пусть даже это профессиональная отраслевая лента новостей — тем же Гуглом вряд ли примется, по-моему. Вам бы сделать отдельный сайт, посвященный технологиям хостинга в целом и подавать его на рассмотрение, но не уверен, что цель будет оправдывать средства.
Проблема возникла только с Google, я привёл текст отказа. Они не хотят видеть рекламу — так её нет в тексте новостей. Про то, что сайт должен быть обязательно новостным требования кажется тоже нет.
В списке источников Google есть специализированные коммерческие компании, например о Plone пишет redomino.com… но это зарубежные компании. может предложить им komtet.com или .org? )
В российском офисе Google, видимо, полагают, что такие новости не нужны, если они исходят не с CNews.ru, хотя в новостях Google по интересующей нас тематике — почти на 100% англоязычные материалы.
Сделать отдельный сайт и вынести туда только новости задача несложная, но Вы правы — оно того не стоит. Была идея — вынести раздел «Информация» с основного сайта — уж очень он разросся статьями, советами и т.п. Вот и «Новости» тоже можно публиковать (дублировать неправильно, я полагаю) на отдельный ресурс.
Спасибо за идею.
Повторно подал заявку по Вашей подсказке (забыл совсем про LI) и после короткой переписки с сотрудниками — нас утвердили. Вот честно — я очень удивился: news.liveinternet.ru/?sources
Вам — ещё раз спасибо, что подвигнули на этот эксперимент, сам бы не решился. Первый прецедент, там ведь были исключительно СМИ.
Кто знает как news.mail.ru подключить?

Ещё один источник: www.lenty.ru (слева ссылка партнёры).
Интересно… узнаю, как это сделать и если будет информация — обязательно дополню материал.
Спасибо.
Так и не получил ответов на письма в news.mail.ru и lenty.ru
Sign up to leave a comment.