Как стать автором
Обновить

Комментарии 23

не хватает третьей кнопки, чтоб скипать когда не хочется оценивать пост, чтоб алгоритм не переобучался в какую-то одну сторону

Можно запросить новый пост командой /send_new
Я делал третью кнопку в начале, но потом убрал, не хотел захламлять

хороший бот, спасибо за ваш труд, буду пользоваться, жду рекламу между постов =)

Спасибо )

Спасибо за шикарный сервис, он явно пойдет в избранные!

А можно сделать выбор из тех 45 категорий каналов, чтоб убрать темы которые мне точно не интересны?

По идее, Олежка сам должен понять какие категории вам не нравятся на основе оценок. В этом и прелесть коллаборативной фильтрации на основе ML — не нужно ничего, кроме самих оценок. Как это будет на практике — будет видно в ближайшие дни. Обычно нужно приличное число оценок (пара сотен), чтобы ваш профиль в системе стал достаточно информативным, и вам будут попадаться только релевантные посты.

Поставил явно более сотни оценок (нет кстати команды глянуть статистику по своему пользователю?), но мне все равно Олег подсовывает новости которые я категорически отправляю только в унитаз...

Такая же фигня.

Возможные причины:
— не так много новостей которые заслужат лайк
— посты, которые не были оценены, получают латентные параметры по наследству от постов в своем канале. Посты в одном канале могут иметь разное качество. Например рекламный пост получит дизлайк скорее всего, но Олег покажет вам его потому что не знает что он рекламный.
— какой-то косяк в системе, но тут я вдоль и поперек все проверял

Будем разбираться
Пишите пожалуйста обратную связь. Типа, поставил 100 оценок, всё равно получаю посты которые мне нафиг не нужны, и всё в таком духе. Будем разбираться
У нас аналогичный сервис, но ранжирование и выборка постов по-другому реализовано и без обратной связи от пользователей, вот тут описывали как все работает: habr.com/ru/post/540876
У вас все на порядок сложнее!

Попались 2 рекламы, незнаю должно ли так быть

Олег не умеет фильтровать посты по контенту, так что реклама в пабликах тоже может попасть в ленту. Я думаю, что это честно: Олег берет чужой контент, так что и рекламу тоже должен транслировать, авторы ведь с этой рекламы себе дошик покупают

Согласен, ничего против рекламы не имею, просто поделился:)

Да тут минимум Говард Воловиц, а не Олег
НЛО прилетело и опубликовало эту надпись здесь

Реализация идеи интересная. Возможно как то увидеть код работы с "нейронкой"?

github.com/Alphafluffykitten/OlegAInn

Весь код планирую открыть чуть позже когда проект наберет юзер базу

Тут было про обратную связь, но других каналов, кроме комментариев я не нашел, поэтому немного статистики:


  • За период с 10.05 по 21.05 было получено от бота 274 сообщения
  • Активных (обратная связь) периодов было 3-4 дня


  • 90% если не 95% обратной связи было отрицательной ( ​ )
  • Статистика по сообщениям от каналов (Source)


Стоит пересмотреть веса, так как явно отрицительной обратной связи( ​ ) больше у большинства каналов. Зачем писать еще сообщений, чтобы получать еще больше отрицательной обратной связи мне непонятно, но так как исходного кода все еще нет, то собрать полный анализ пока не могу + у меня нет отчета о проставленных мною оценках.

Спасибо!
Вот тут код касающийся коллаборативной фильтрации:
github.com/Alphafluffykitten/OlegAInn

Весь код пока не открываю.

Я давно заметил что отрицательная оценка слабо влияет на будущие показы постов с канала. То есть она влияет, Олег явно чему-то научается со временем, мусора сейчас как будто меньше шлёт. Но я бы хотел сделать лучше. Сейчас как раз пытаюсь понять как это сделать.

Почему-то спойлеры не отрабатывают, а редактирование запрещено, поэтому продублирую информацию в спойлерах из оригинального сообщения ниже.


Но я бы хотел сделать лучше. Сейчас как раз пытаюсь понять как это сделать.

Также достаточно странная выборка получается, как будто каналов не так уж и много (10-20) с которых собирается информация, то есть это не похоже на "вся российская телега", но интеллектуальная с выбором. Но гораздо удобнее множества каналов и простых агрегаторов. Ждем открытия кода и может быть сообщество чем поможет)


Еще из интересного я отметил, что многие посты с задержками присылаются, хотя они по времени очень важны, например, куча новостей про парад победы приходила 12-17 мая, в то время как очевидно, что после 10 уже наверное не имеет смысла посылать, но это тулинг уже какой-то.


Статистика по дням
{
  10: 62,
  11: 5,
  12: 41,
  13: 7,
  14: 17,
  15: 66,
  16: 5,
  17: 16,
  18: 14,
  19: 5,
  20: 4,
  21: 32
}

Статистика по полученным сообщения (Source)
   1  Bird In Flight
   1  Chelsea​
   1  Distantsiya
   1  English for Life
   1  HotPrice от Pepper.ru
   1  INSIDE | Трансферы
   1  IT Юмор
   1  Kosmos Time | Наука | Физика
   1  Life-Hack Жизнь-Взлом/Хакинг
   1  N + 1
   1  NAVODKA
   1  PLUSHEV/ПЛЮЩЕВ
   1  ParaGraph
   1  Rus_criminal
   1  Stanislav | Trade
   1  Stickers
   1  Stickers save ​️​️​️
   1  TELEGRA4CH
   1  Telegram Stickers | Стикеры
   1  Travelata
   1  Xiaomi | Сяоми | Гаджеты | Смартфоны
   1  М Е Д И Ц И Н А
   1  Мы вам перезвоним
   1  Идeи HandMade
   1  ∏ρ؃uñçτØρ Øπτµç∑ |
Также достаточно странная выборка получается, как будто каналов не так уж и много

Да, каналов сейчас 580, я только что закончил код который позволяет добавлять еще Listener'ов (аккаунты Телеги которые подписаны на каналы). Сейчас добавляю сами аккаунты.

Еще из интересного я отметил, что многие посты с задержками присылаются, хотя они по времени очень важны

Есть такая проблема, пока что не приступал к ее решению, но думаю что когда я займусь переписыванием механизма фильтрации, я сделаю еще один фильтр который понижает важность старых сообщений. Всё таки Телега это больше про актуальное здесь и сейчас чем про вечное

я новый пользователь и не совладал с интерфейсом комментариев. прошу удалить последние 2 комментария) впредь буду знать об ограничениях на длину спойлера.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации