Подобное использование сервиса является технически возможным. Но как-то уж повелось, что наши пользователи (из тех что публикуют RSS-потоки на своих сайтах) — законопослушные люди, в основном владельцы небольших персональных сайтов, некоммерческих и общественных организаций. В общем, нам наши клиенты очень нравятся, и мы сами готовы выразить им всяческую благодарность. :)
Да, тут имеет место быть компромис между сложностью создания канала и качеством результата. Другие похожие сервисы, например FeedYes, создают канал практически в один клик, просто выгребая с исходной страницы все ссылки (и давая возможность их неким образом отфильтровать). Но удобство пользования таким каналом стремится к нулю. Feed43 позволяет сделать действительно удобный канал, с полноценным и удобно отформатированным контентом, но, кончено, придется немного размять мозги…
Идея была обыграть цепочку «Feed43 => feed-four-three => feed-for-free». Но теперь это уже неважно, главное, что имя получилось короткое и — надеюсь — запоминающееся.
ну лично у меня там висит один bash.org(англоязычный который) и он не так уж и часто обновляется, а от таймаутов в фиде мне никак не легче, всёравно лично я с этим ничего не сделаю
так что да, галку «включить ошибки в фид» было бы неплохо
таймаут был один раз, кроме него ещё есть
ERROR: One of search patterns is too heavy or malformed. See help for more information.
и
ERROR: Source page is empty, try to reload
до этого полгода работало как часы, я так понимаю в связи с повысившейся нагрузкой началось?
Нагрузка повышалась, мы недавно переехали на выделенный сервер. Сейчас нагрузка в норме (и плюс таймаут увеличен), так что первая ошибка должна уйти. Насчет второй интереснее. Как только она у вас еще раз проявится, стучитесь, попробуем ее за хвост поймать.
А можно как-нибудь добавить поддержку cookies для сайтов, где нужна авторизация?
В uTorrent например можно указать такой адрес фида: lostfilm.tv/rssdd.xml: COOKIE: uid=31337; pass=9c3e51111e7e5ed9df35c33fb35b4f0f
Мне кажется тут тоже можно как-то организовать…
Не люблю я особо рассказывать про радужные планы, но планируется добавить поддержку POST-запросов (а редиректы и приходящие с сайта куки поддерживаются уже сейчас), так что можно будет сымитировать процедуру отправки формы (логина/пароля) и открытие запароленной страницы. Видимо, поле для ввода кук надо будет добавить явно.
Насчет периода обновления: Feed43 работает как прокси, и запрашивает страницу в тот момент, когда вы запрашиваете URL RSS-канала. По своей инициативе он никуда (и ни с какой периодичностью) не лезет. Подробнее о принципе действия можно почитать в наших Вопросах и ответах
Спасибо, теперь до меня дошло, что это за кнопка. :) В Опере, кстати, её тоже видно, на том же месте — в строке адреса.
Меня сбивало с толку то, что она её появление не связано однозначно с наличием ссылки на RSS на странице. Вот на polit.ru, например, этой кнопки не видно ни в Опере, ни в Файрфоксе, хотя ссылка есть.
На моей страничке greesha.ru эту кнопку тоже ни опера, ни файрфокс не показывают. Хотя ссылка на RSS присутствует, и сам канал проверен на feedvalidator.org. Видимо, браузеры принимают решение о показе кнопки исходя из каких-то особенностей самой ссылки.
Я больше привык к Опере, кстати, Файрфокс запускаю только в случае крайней необходимости — например, когда нужно зайти на страничку под разными эккаунтами.
А IE не запускаю никогда. Вообще. Мне можно, я не веб-дизайнер. :)
Есть такая штука как RSS autodiscovery. Это специальный линк внутри HTML (по аналогии с явной ссылкой на favicon.ico). Когда он есть, браузер отображает свою кнопку-иконку в поле адреса или еще где. Нет такой ссылки — нет иконки. Ссылок, кстати, может быть несколько (на разные каналы), тогда при нажатии на эту кнопку в браузере вы увидите ниспадающее меню с перечнем RSS-каналов.
Существуют, кончено, случаи, когда с наскоку написать шаблон не получается, но обычно все не так плохо. Давайте попробуем вместе. Какую страницу и какой контент на ней хочется мониторить?
Вот страничка. cyxapeff.imhonet.ru/rates/all/
Хочется вытаскивать как минимум «Название» (русское и если есть английское), оценку, дату когда читал\смотрел (если указана). Если сможете сделать такой шаблон — памятник поставлю :)
Читалки новостей (Лента Яндекса и Google Reader в нашем случае) запрашивают фид с определенной периодичностью (раз в 15 минут или раз в час — неважно). Feed43 загружает в этот момент контент с сайта, парсит, выдает фид читалке и кеширует этот канал на 6 часов. Т.е. в течение этого времени при последующих обращениях он будет выдавать уже сгенерированный RSS. Через 6 часов, в момент очередного запросе канала любым клиентом, он опять полезет за указанной страницей. Для платных каналов время кеширования 1 час.
Огромное спасибо за сервис! Сам ещё пару лет назад думал создать ровно такой же — чтобы делать RSS для сайтов, которые его не предоставляют, — но поленился. Пойду плюсовать карму :)!
спасибо. давно пользуюсь вашим сервисом.
какое-то время назад возникла проблема, при использовании совместо с ридерами от newsgator (netnewswire и feedeamon) — проблема заключалась в том, что вы их (newsgator) заблокировали за очень частое обращение к вам. пришлось создавать для каждого фида фид на feedburnerе и проблема как бы исчерпалась.
техника построения очень напоминает WatzNew — которой пользуюсь до сих пор — но это никак не минус, а скорее плюс. Избавлюсь от лишнего ярлыка в трее.
Отлично.
WatzNew тоже я написал (только тс-с-с!). Давно это было…
Если вы являетесь платным пользователем WatzNew, напишите мне через форму обратной связи на сайте Feed43.com имя пользователя и email, указанный при регистрации, и я выдам вам год платной подписки на Feed43.
В RSS нет понятия «краткой» и «полной» новости. В каждой новости (item) есть поле description, где может идти все что угодно. Кто-то помещает туда только анонсы новостей, кто-то выкладывает туда полные статьи. Вы можете создавать с помощью Feed43 RSS c полным текстом новостей при условии что они расположены на одной странице.
А у сайта есть список популярных открытых трянсляций сайтов? Чтобы и посмотреть что-то интересное, и не мучаться с созданием трансляции, если таковая уже существует.
Вот создал ленту Новостей спорт-экспресса feed43.com/sport-express_news.xml. Тут же напарсило 13 новостей в рсс. Потом долго не было обновлений, ну, думаю, лента ведь бесплатная, наверное кэшируется раз в несколько часов (6 часов как оказалось). Прошла ночь, а точнее часов 12. В ленте появилось только две новости, хотя на сайте они появляются раз в 5-10-15 минут.
Тут надо смотреть свойства канала. Возможная причина — поисковый шаблон настроен так, что выгребает не все новости. проверить это легко — зайдите в редактор канала и посчитайте количество найденных новостей и сравните их с количеством, видимым на сайте. Если количество расходится, то надо подправить шаблон.
Должно быть так: выгребли все новости со страницы, прошло 6 часов, при очередном обновлении выгребли опять все новости (а в ридере отобразятся новыми только те, которых не было в канале в прошлый раз; при очень частом обновлении исходной страницы новыми могут быть все). Если какие-то новости не были подхвачены Feed43 из-за кэширования (т.е. полностью появились и успели уйти со страницы за 6 часов), то таких новостей в ленте не будет. В случае со Спорт-Экспрессом это можно решить, создав несколько отдельных каналов по разным рубрикам. Тогда частота появления новостей в рубрике будет не такой большой.
Вот так сюрприз — оказывается, feed43 написал русский :)
Я почему-то все время думал, что это проект какой-то буржуйской команды. Где-то год назад его увидел и мысленно поапплодировал идее и реализации. И пользователю полезно и масса входящих ссылок совершенно бесплатно. :)
Если позволите, вопрос немного офтоп-направленности. На каком сервере сейчас работает проект и как сильно его грузит?
Сейчас Feed43 сидит на выделенном сервере вот такой конфигурации:
* AMD 4200x2 Dual-Core CPU
* 1200 GB Premium Bandwidth
* 1 GB Ram Memory
* 250 GB Sata Drive
Загрузка CPU примерно 25-30%. Трафик порядка 2Гб в день.
Сервис Feed43 теперь говорит по-русски