ru_vds 20 янв в 16:01

Почему нам всем стоит отказаться от соцсетей в пользу RSS

Простой

6 мин

21K

Блог компании RUVDS.comIT-стандарты*Социальные сети и сообществаУчебный процесс в IT

Обзор

Перевод

+80

Комментарии 98

JBFW 20 янв в 16:09

RSS - еще одна забытая технология )

Его зарезали потому что нет фидбека от юзеров, ты читаешь новости - но никто не знает какие прочитал, какие пропустил, какие вообще бот просматривает.
Нет фидбека - нельзя посчитать рекламный охват.
Нельзя посчитать охват - нечего предьявить рекламодателям, это как кричать в пустоту за деньги.
Нет рекламодателей - никому это неинтересно.

Но может быть и вернут его когда-нибудь: по ТВ тоже неизвестно сколько конкретно людей посмотрит рекламу, есть только рейтинги передач, однако реклама продается.

urvanov 20 янв в 16:12

У хабра всё ещё есть RSS

qeeveex 29 янв в 13:54

Подтверждаю. Перешел из rss. Если что клиент Tiny Tiny RSS.

mavir 20 янв в 16:21

Его зарезали потому что нет фидбека от юзеров, ты читаешь новости - но никто не знает какие прочитал, какие пропустил, какие вообще бот просматривает.

Какие новости прочитал вполне знают, так как в RSS только аннотацию, а не весь текст новости. Полный текст доступен на сайте после перехода на сайт

(перешел в эту новость из RSS)

alexs963 20 янв в 17:23

есть rss2full, с хабром справляется.

JBFW 20 янв в 18:54

снижение охвата. Так вы зашли на сайт, посмотрели 10 заголовков статей , 3 страницы и 24 рекламы, а по ссылке вы зашли на статью, посмотрели ее, хорошо если 8 реклам, и ушли. Или вообще не зашли, если не цепляет.

Ценность рекламной площадки падает.

bromium 20 янв в 21:07

В rss фидах тоже бывает реклама

ssh236a 25 янв в 12:55

Какие новости прочитал вполне знают, так как в RSS только аннотацию, а не весь текст новости. Полный текст доступен на сайте после перехода на сайт

для них это выглядит как "переход по ссылке", но теоретически они могут в урл вставлять параметры для отслеживания

ps. тоже перешел из RSS

baldr 20 янв в 16:23

Да, в том-то и проблема. RSS удобен для пользователей, но его должны внедрять издатели, которым он, как раз, портит все показатели. Это как если бы фейсбук блокировал всю рекламу - она пользователю мешает же.

unreal_undead2 20 янв в 17:00

Его зарезали

Кто зарезал? У меня пара десятков активных каналов в feedly, всё обновляется.

alexanderniki 20 янв в 17:40

Если у вас пара десятков канало в Feedly, это еще не означает, что технология сама по себе популярна и активно используется.

А вообще, все меньше и меньше сайтов и блогов поддерживают RSS фиды и с каждым годом находить ленты становится все сложнее.

kt97679 20 янв в 17:52

Есть сайты, которые генерят рсс. К примеру вот: https://politepol.com/en/faq

zelenin 21 янв в 01:29

технология действительно уже непопулярна у пользователей, но сам RSS едва ли исчез. Все сайты, RSS которых я хотел бы добавить, его содержали. RSS - все еще главный источник моего ежедневного чтива

JBFW 20 янв в 18:50

Лет 15 назад их было бы пару десятков тысяч разных, чуть ли не каждый сайт, особенно новостной, размещал.

zelenin 21 янв в 01:29

и до сих пор размещает

unreal_undead2 21 янв в 09:49

Лично мне больше не надо. И проверяю ленту несколько раз в день, при этом в vk или телегу могу неделями не заходить.

yrub 21 янв в 01:42

все можно, картинку вставляешь и трекаешь. фид загружаешь - значит тема интересна. web rss (которые перенаправляют в почту) еще тебе и рекламу лепят. Конечно с браузера проще собрать сложную аналитику, типа как курсором водил. Главная проблема rss - эта лента заканчивается, а лента inst или fb не заканчивается никогда ;) мне rss нравится именно за порядок: я знаю что я ничего не пропущу и могу досмотреть до конца позже.

Kurochkin 21 янв в 13:59

По ТВ всем всё известно уже давно. На важных рынках когда-то компании вроде Nielsen ставили людям ТВ-приставки (которые и фиксировали всю статистику), сейчас ваш клиент ip-tv всё знает, а СмартТВ сделает посекундные снимки экрана (конечно же анонимно и безопасно) да и отправит производителю.

unreal_undead2 21 янв в 14:19

сейчас ваш клиент ip-tv всё знает

У меня к телевизору только антенна подключена, никакого ip.

LavaLava 20 янв в 16:12

Напомнило инфоцыган диетологов и нутрицилогов. Они тоже говорят что надо только ПРАВИЛЬНОЕ, ЗДОРОВОЕ, ПОЛЕЗНОЕ. Они не говорят: хорош ~~жрать~~ листать ленты, это убивает мозг количеством, а не качеством.

/Продолжил листать дальше/

Dart55 20 янв в 16:43

После слов «На сцене появляется… RSS» хотел пошутить про зуммеров и год разработки RSS, но в оригинале «Enter: RSS»

BugM 20 янв в 18:23

А зачем это все сайтам?

Они теряют просмотры, посещения, показы рекламы и деньги. А получают ничего.

cdriper 21 янв в 14:09

если preview интересное -- они получают переход

если у них нет RSS, они теряют аудиторию, которая ценит свое время

BugM 21 янв в 15:01

И получают всю остальную аудиторию. И не один просмотр, а листание ленты и несколько просмотров. Обмен выглядит выгодным.

qw1 26 янв в 12:54

Мне кажется, аудитории уже не пересекаются. Если бы на Хабре не было RSS, вряд ли бы я читал его регулярно: заходил бы только с выдачи поисковика, и всё.

BugM 26 янв в 14:01

Вы нет, а кто-то другой стал бы. Каждый конкретный посетитель не важен. Считать что никто не станет явно ошибочно. RSS мертв и люди заходят на сайты.

inkelyad 26 янв в 14:17

RSS мертв и люди заходят на сайты.

Тут, кстати, интересен вопрос, кто виноват в том, что браузеры перестали показывать знак о том, что страница RSS имеет. Ну ладно, встроенный клиент для RSS не получился и его выпилили. А индикацию наличия почему не оставили?

qw1 27 янв в 09:45

Я поставил расширение и всё вернулось: https://addons.mozilla.org/en-US/firefox/addon/want-my-rss/

Что касается последних UI-решений в браузерах, не счесть, сколько олдфагами было написано возмущённых призывов перестать ломать браузеры. Но видимо пришло новое поколение менеджеров и они всё переделывают под своё видение.

inkelyad 27 янв в 09:50

Я поставил расширение

Да нет, это понятно, что можно вернуть. Но это только для тех, кто уже знает, что оно такое бывает. Смысл в том, что сигнализация 'из коробки' подсказывает и тем, кто не знает. Ну или напоминает тем, кто знает. Вон, у меня Edge демонстрирует, что у хабра какое-то приложение есть, но не показывает, что тут где-то RSS есть. А что это так?

qw1 27 янв в 10:17

Наверное, ориентируются на основную массу пользователей.

То есть, мотивация создателей браузера не в том, чтобы "мы разместим иконку RSS, чтобы пропиарить RSS среди пользователей", а в том, чтобы "сделаем настройки по умолчанию такими, чтобы большинству не пришлось кастомизировать браузер, а можно было сразу пользоваться".

То есть, когда-то большинство ставило RSS-кнопку, и её включили в стандартную поставку. Сейчас же большинство будет удалять RSS-кнопку (те, кто настраивает интерфейс под себя и убирает с панелей всё, чем не пользуется), вот её и убрали заранее.

inkelyad 27 янв в 10:34

Наверное, ориентируются на основную массу пользователей.

Ни верю ни разу про такой образ мыслей. Вон, та самая иконка о наличии приложений в Edge даже не знаю, как убирается. Или там же регулярно что-то про какие-то купоны выскакивает. Или у того же Firefox Pocket, помнится, был - тут пользователей вообще, кажется, не спросили.

qw1 27 янв в 08:49

RSS мертв и люди заходят на сайты

В этом смысле и контентные сайты мертвы. И что теперь, бросать сайт и открывать группу в VK?

BugM 27 янв в 10:28

У любого контентного сайта есть группа в ВК. Перепостами в несколько мест давно уже все занимаются. Соцсеточки обязательны для любого контентного сайта. Дешевый источник лидов.

Что не так?

qw1 27 янв в 11:02

Конечно, не так. Следуя вашей логике, читатель будет потреблять рекламу платформы, а не сайта, делать меньше просмотров на сайте, а это упущенная прибыль.

BugM 27 янв в 11:04

Как завлечь посетителя к себе на сайт это проблема сайта. В целом все как обычно. Постим в ВК заголовки в том числе в меру кликбейтные, приглашаем пообщаться в комментариях и все такое. Проблема давно решена.

qw1 27 янв в 13:13

Чем это отличается от RSS?

BugM 27 янв в 14:06

Всем. ВК привлекает аудиторию. Это его основная задача. RSS наоборот отталкивает аудиторию. Механизмов привлечения там нет.

qw1 27 янв в 14:33

RSS - инструмент удержания, а не привлечения.
Я зашёл на сайт, почитал, понравилось. И у меня две возможности: добавить в свой RSS, чтобы получать обновления и читать дальше, или периодически вспоминать об этом сайте, заходить проверять обновления вручную. Конечно, 2-й вариант проигрывает, потому что сайтов много, с чего бы мне их все помнить.

BugM 27 янв в 15:12

А никому не нужен пользователь который будет не заходя на сайт и не смотря рекламу потреблять контент. За этот контент деньги платили, окупать его как?

qw1 27 янв в 17:29

Ну и этот юзер так же подпишется на ленту в vk, будет переходить выборочно на заинтересовавшие его статьи. Желаемое владельцем сайта "листание ленты" будет в vk, а не на сайте. Всё как и в случае с RSS.

BugM 27 янв в 17:38

ВК это канал куда пользователи приходят извне. Это окупает примерно все его недостатки. Поиск новой аудитории это очень сложная задача.

qw1 27 янв в 18:03

RSS - способ сделать пользователя лояльным. Чтобы он ещё раз зашёл в будущем.

kanasero 20 янв в 18:48

я наткнулся на относительно малоизвестную сегодня старую бесплатную и опенсорсную технологию

Вот в этот момент почувствовал себя старым, осознав, что кто-то только открыл эту технологию "из прошлого", случайно на нее наткнувшись, в то время как во времена моей вроде бы еще не такой далекой юности эта технология была в самом расцвете :)

inkelyad 20 янв в 21:52

(тяжело вздыхая и чествуя себя совсем-совсем старым) А было еще и nntp... Не обязательно даже с пересылкой контента с сервера на сервер.

Скажем, любому форумно-статейному сайту вида Хабра можно nntp сервер/шлюз держать - и читателям не нужно будет мучаться со странным представлением дерева комментариев.

AVX 20 янв в 22:30

Эх, я помню те прекрасные времена, когда в корп сети РЖД были "ньюса" (именно так называл это народ), Outlook Express, win98-xp... Трафик минимальный, удобство, и всë локально сохранялось, если посмотрел уже. Поиск по содержанию ещë.

В интернете тоже кстати было это, но в середине 2000х это уже был конец эпохи.

bromium 20 янв в 21:10

Вначале они закрывают yahoo pipes (очень скучаю по ним), google rss reader (шок и переползание на feedly), а теперь через 15 лет кто-то открывает для себя rss

slonopotamus 20 янв в 21:14

Ну то есть, настраивать фильтрацию на сайте ему влом:

Хотя на некоторых сайтах есть опции фильтрации или сортировки, настраивать их каждый раз при посещении каждого сабреддита просто нереально.

Но настраивать ту же самую фильтрацию в RSS уже не влом:

поэтому можно получать RSS-фид через посредника, а также выполнять с ним дополнительные действия, например, фильтрацию.

Где логика, а?

V1RuS 21 янв в 14:41

так в RSS-фиде фильтр один раз настроил и забыл, а на сайте он каждый раз сбрасывается

slonopotamus 23 янв в 00:25

Каждый раз когда что?

zetroot 23 янв в 12:32

Когда сбрасывается.

V1tol 20 янв в 21:44

Люди недооценивают как много полезных сайтов содержат RSS фиды. Среди неочевидных - атомы на страничках статусов различных сервисов (AWS, Github, Docker, Slack), Github/Gitlab коммиты/теги/релизы, Youtube каналы. Блоги это самый тривиальный и скучный вариант использования.

ForeverLive 20 янв в 21:55

Очень странно. Я еще решил пересмотреть сериал Lost и вернуться на Лепрозорий. И тут еще RSS внезапно забытая технология. Верните мой 2009-й. Помню RSS ридерами все пользовались только недавно, даже в адресной строке Firefox была иконка RSS. Время сломалось как-то и последние 15 лет прошли слишком быстро.

qeeveex 29 янв в 14:01

чётник?

astenix 21 янв в 00:19

До появления Facebook и прочих источников у меня было много лент в RSS-читалке. Потом как-то угас интерес и к FB, и к прочим. Недавно заглянул в Feedly (после закрытия Google Reader ничего лучшего не нашлось). Там осталось 6 источников, из них два интересные, остальное хлам.

RSS в наше время перетек в основной способ распространения подкастов, например. Что-то другое — ну, есть еще энтузиасты с блогами на WP, но…

zelenin 21 янв в 01:33

RSS никуда не делся. вы просто перестали видеть иконку RSS в браузере.

cdriper 21 янв в 14:11

для кучи людей это по прежнему основной источник информации

большинство сайтов по прежнему отдают RSS как и 15 лет назад

на эту статью я точно так же зашел с RSS ленты

RedHead 21 янв в 00:32

Мы за пол часа до "ленту читает ИИ и выдает только главное тезисно", а тут стюардессу откопали.

peterjohnsons 21 янв в 00:59

Плюсую. Сам мечтаю что ИИ сможет парсить любой источник новостей и фильтровать индивидуально предпочтениям пользователя. Из видео роликов чтобы брал титры и суммаризацию делал (чтобы было понятно стоит тратить своё время на просмотр или нет), или же распознавание речи использовал если нет субтитров. Возможно уже есть подобный сервис, не гуглил.

rPman 21 янв в 08:40

Хороший будет дорогим, платить за него не будут

astenix 21 янв в 10:03

unstuckstudy.com

Читает тексты, pdf и видео на youtube. Затем делает краткие саммари, большей частью бестолковые, но иногда удачно (если привыкнуть).

peterjohnsons 21 янв в 00:56

Поддерживаю. Меня настолько задрали умные алгоритмы ютуба и прочих соцсетей, что заморочился, выдрал с подсказками ChatGPT все подписки с ютуба, с соцсетей, там где rss поддерживался. Поставил в браузере расширение FeedBro, закинул туда все эти источники rss и настроил под себя правила, которые удаляли спам и рекламу. И ЗАЖИЛ! Теперь всё под моим контролем, все источники новостей в одном месте. Зафиксировал закладку с лентой FeedBro. Из минусов то, что в новостях из телеграм каналов нельзя сразу в ленте видео запустить, приходится кликать и переходить на сам пост в телеграме, благо редирект из браузера в Телеграм не сильно напрягает. Так же отвалились недавно rss подписки ВК, после их редизайна, похерили RSS. И почти незаметный минус это то, что FeedBro не умеет ленту показывать сразу же после запуска браузера, изза ограничений API браузера видимо, приходится F5 нажимать один раз, привык.

mrprogre 21 янв в 01:34

Класс, как будто я статью писал! Той же темой занимаюсь, только я сделала бота. Название писать не буду :) Я отобрал основные источники, у которых есть рсс, там где сложно - забил, слишком много времени отнимает это. Повестка всё равно видна. Зачем тратить время на 20, когда 80 дает почти все ответы..

Yuriy_krd 21 янв в 14:10

вы бы с полом определились :) а то есть

только я сделала бота.

и в то же время:

Я отобрал основные источники

mrprogre 21 янв в 14:13

упс.. есть только ДВА ПОЛА!!!! Ламинат и паркет! :)

zwalker 21 янв в 07:16

Есть еще yarr https://github.com/nkanaev/yarr

Хорошая штука. Легкий. Ничего лишнего. Подтягивает полные новости.

opusmode 21 янв в 08:14

Я и так отказался от соцсетей. Но RSS не хочу. Хочу что-то более современное и актуальное

yppro 22 янв в 16:55

Хочу что-то более современное и актуальное

Телеграм?

kzld 23 янв в 00:41

Терпеть не могу телегу, но приходиться использовать. Интересно, под неё сделали какой-либо телега-менеджер

molnij 21 янв в 08:52

Полгода назад в этом же хаброблоге https://habr.com/ru/companies/ruvds/articles/833322/ и даже авторская. А тут вдруг ррраз и перевод восторгов неофита о давно забытых технологиях предков :D

kareon 21 янв в 12:07

Про RSS я конечно знаю, но как через него подписаться не только на ютюб, но на инстаграм юзеров (включая закрытых) и телеграм каналы?

unreal_undead2 21 янв в 13:09

В такой постановке - наверное никак. Если поставить вопрос по другому - как получать новости в какой то области - науке/индустрии/просто в каком то городе и т.п. - можно поискать соотвествующие feed'ы.

inkelyad 21 янв в 13:19

Написать демон-шлюз(если еще никто не написал), который вместо тебя будет ходить в телеграмм и инстаграм и выдавать RSS ленту?

Kenya-West 21 янв в 14:30

Я читаю VK и TG через RSS. 800+ каналов. Живём-живём.

unreal_undead2 21 янв в 16:27

Спасибо, не знал что есть готовые бриджи. Вопрос насколько этим реально пользоваться без своего сервера - мне vkbrdige даже один фид не смог нарисовать, Call to a member function getAttribute() on null где то в потрохах.

mad_pam 21 янв в 12:57

Читаю половину контента через RSS уже лет 15 и прекращать не планирую.

Sadok 21 янв в 16:56

не понял. зумеры открыли для себя rss?

yppro 22 янв в 16:46

Лучше QuiteRSS так и не нашёл

c46fd3da 22 янв в 19:06

RSS пользуюсь очень давно, а вот с INOREADER ушел совсем недавно на вот это решение:

https://github.com/HenryQW/Awesome-TTRSS

После небольшой обработки напильником работает ничуть не хуже.

gromcan 22 янв в 20:13

обьясните тупорезу, который пытался ответить себе последние 20 лет , чем RSS реально лучше твиттера? в твиттере есть лента только моих подписок. Да, реклама каждые n-постов, но пролистывается. Подписаться легко на кого хочешь, чтобы не говорили про RSS. Новости не пропускаю.

Если подписаться только на RSS канал youtube, то я пропущу реально полезные рекомендации его алгоритмов. Youtube мне выдает со временем более качественный контент на интересные мне темы

rPman 22 янв в 20:23

потому что в твиттере только те источники информации, что постят в твиттере

а rss можно собирать ото всюду, где есть такая возможность (или есть посредник) и главное, оно официально машиночитаемо, что позволяет делать больше фильтраций и оптимизаций, чем то что предлагает конкретный сервис

k4ir05 23 янв в 03:53

Плюс читать rss можно в разных программах на выбор, хоть в браузере. И регистрироваться для этого нигде не надо.

unreal_undead2 23 янв в 10:27

Во первых, не уверен что в твиттере есть, скажем, НТА Приволжье, где попадаются актуальные локальные новости, во вторых, не представляю как там читать, скажем, Реймонда Чена (если он там вообще есть) - в RSS ленте все статьи сразу показываются полностью.

kzld 23 янв в 00:45

Я бы вообще вернулся к телеконференциям usenet .
Почему? Объясняю.
Допустим я занимаюсь продажей запчастей для легкового автомобиля мерседес,
именно продажей запчастей а не тюнингом допустим.
И я подписываюсь на соответствующую телеконференцию.
автомобили.легковые.мерседес.запчасти.торговля
Теперь если я желаю продать бензонасос от мерса, то просто пишу
ПРОДАЮ БЕНЗОНАСОС МЕРСЕДЕС МАРКА ЦЕНА КОНТАКТЫ
и все , повторяю все кто подписан на соответствующую конференцию видят моё
объявление.
Что происходит сейчас :
Давайте попробуем разобраться на примере покупки того же бензонасоса от
того же мерса.
Первым делом ПОИСКОВИК, далее кликаем на ссылки , много ссылок кликаем
Ага, вот что то похожее. А вот здесь бывает непруха, контактные данные
продавца скрыты. Что бы их увидеть надо зарегистрироваться, на забыть
записать на обязательно желтом листочке данные регистрации. Листочек
конечно же вскорости потеряется. Надо ещё подтвердить регистрацию (обычно через
почту). Особо умные сайты ещё добавляют и через SMS.
О сколько руко-мышко-движений. И всё ради того, что бы узнать стоимость и
локацию этого самого бензонасоса.

unreal_undead2 23 янв в 10:29

Можно бы и ФИДО оживить )

inkelyad 23 янв в 12:08

Я бы вообще вернулся к телеконференциям usenet .

Оно издохло - спам их убил.

Теперь если я желаю продать бензонасос от мерса, то просто пишу
...
Давайте попробуем разобраться на примере покупки того же бензонасоса оттого же мерса.

Только нужную группу и сервер придется найти. Потом выкачать архив и уже по нему найти то, что хочешь купить, просмотрев (самостоятельно, без поисковиков?) миллион сообщений. Потом связываться или ходить на сайт продавца, чтобы выяснять, актуально ли еще предложение по продаже.

Так что какой-то неубедительный пример.

tsvetkovpa 23 янв в 09:57

Пару нет назад тоже дошёл до осознания проблемы перегрузки информацией из новостей и запилил себе нейросетевой фильтр, который читает RSS фиды и постит мне в Телеграм, что потенциально мне понравится.

К сожалению мое решение не скейлится - пришлось руками разметить около 4000 новостей, прежде чем он начал приемлемо работать.

Для публичного продукта надо подходы типа коллаборативной фильтрации использовать.

rPman 23 янв в 18:49

опишите технические подробности решения? как размечали? чем именно фильтруете? какой софт/библиотеки использовали?

tsvetkovpa 23 янв в 20:04

Использовал предобученную модель от Сбера https://huggingface.co/ai-forever/ruBert-base в режиме классификатора.
Использовал библиотеки pytorch и transformers для файн-тюнинга.

Первичный датасет разметил при помощи Doccano, потом система вошла в закрытый цикл и стала учиться на лайках/дислайках, которые я ставил в Телеграме.

Обучение на GPU на ноутбуке. Инференс на CPU на файлопомойке от Synology в докере.

Схема работы получается примерно такая.
По таймеру система просыпается, скачивает новости с RSS каналов, прогоняет через нейросетевой классификатор, и если вероятность полученная от классификатора выше порогового значения, то присылает мне ссылку в Телегу.

Там я могу полайкать-дислайкать - эта инфа ложится обратно в базу новостей и используется для дальнейшей обучения.

Переобучение запускал руками время от времени. Перестал это делать когда датасет разросся до примерно 20 тыс. Работает больше года так.

rPman 23 янв в 22:55

что являлось входом в llm-ку? ты формировал текст из заголовка? тегов? источника? вся статья? ты подаешь статью и требуешь от модели один символ ответа (типа да/нет по первой букве или какой там токен), добавлял системный промпт? до текста статьи? после статьи? какую библиотеку и алгоритм файнтюна использовал? peft? блокировались ли какие-либо слои для обучения? может есть готовый notebook или пример кода?

tsvetkovpa 24 янв в 13:35

Текст для классификации формировал из заголовка и той части текста статьи, который был доступен в RSS (в некоторых фидах только заголовок).

Код писал пользуясь этим примером. https://huggingface.co/docs/transformers/en/training

Первый пайплайн собрать довольно быстро. Больше времени писал сбор и хранение данных. Ну и потом игрался с подбором параметров обучения.

Из моих отличий. Датасет сильно несбалансированный по классам. Пришлось добавить Sample Weights.

У видяхи всего 8 GB Ram, влезал батч максимум на 6 сэмплов. Использовал Gradient Accumulation (слава богу transformers это умеет из коробки, просто параметр включить), подобрал оптимальный батч 384 сэмпла.

Обучение проводил в два этапа. На первом этапе учил только слои классификатора и замораживал все остальное.
На втором этапе размораживал слоит трансформера, но оставлял замороженными эмбеддинги токенов. И уменьшал шаг обучения.

Смотрел по тензорборду на метрики и выбирал модель, которая нравилась мне по метрикам.

Ввёл кастомную метрику качества, сколько процентов статей мне придется просмотреть по порядку, если их отсортировать по скору от нейросетки, прежде чем я найду 90% от всех интересных статей.

rPman 24 янв в 17:45

Спасибо за развернутый комментарий... в итоге вы остались довольны результатом, или душа требует улучшений и дообучения модели?

Ввёл кастомную метрику качества, сколько процентов статей мне придется просмотреть по порядку, если их отсортировать по скору от нейросетки, прежде чем я найду 90% от всех интересных статей.

Rакая интересная метрика

tsvetkovpa 24 янв в 21:39

Из того что хотелось бы поменять, наверное только подход к дообучению. Т.е. не учить на том, что модель разметила. А то получается что из всего набора новостей она отбирает процентов 10%, с явным смещением в сторону науки и техники, и они же потом с моими лайками-дислайками добавляются в датасет, из за чего там со временем растет пропорция таких новостей и распределение начинает отличатся от изначального, когда я руками размечал все подряд.

Видимо надо, чтобы она подкидывала случайные новости в телеграм и именно их добавлять в датасет. Обычная проблема Exploration vs Exploitation.

rPman 24 янв в 22:35

наверное поэтому алгоритмы тиктока и тех же ютуб шортсов, сыпят в ленту мусора чуть ли не половину

p.s. правда даже если я минусую шортс, они все равно могут мне его подкинуть, в общем я бросил попытки заставить их алгоритм работать на мои интересы

3aBulon 23 янв в 10:52

Как на Хабре прочитать ленту далее 50 страниц? Бесит это ограничение.

cssfish 12 мар в 18:33

ответ был тут, и он вам не понравится...

LiquidBlasted 24 янв в 00:43

Если на сайте вдруг нет RSS - не нужен значит сайт этот. Вот и Хабр читаю только переходя с RSS.

rombell 26 янв в 06:54

На дзене есть пара интересных каналов, но нет RSS, или я не нашёл его. Поэтому не читаю. Но, может, есть способ прикрутить туда?

alexs963 26 янв в 20:43

В rss-bridge есть какой-то бридж для дзена, но не знаю рабочий ли.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий