Pull to refresh

Comments 29

Для того же самого используем локальную gemma3-4b для отсеивания спама на почте. Раньше справлялся штатный спам-фильтр, но рекламщики стали креативней и фильтр справляться перестал. Не в последнюю очередь, видимо, из-за того, что на помощь рекламщикам пришли нейронки. Ну и мы себе в помощь одну пристроили и нормально. Крутится локально, по затратам практически бесплатно

А на каком железе она у вас живет?

На rtx 2060 super, купленной на авито 😅, занимает половину видеопамяти, оставшуюся заняли нейротранскрибатором

хм, она разве видео кушает? я когда в скрепыше ставил ее и смотрел, в основном оперативку только кушало, и работала очень быстро

Вряд ли "практически бесплатно". Стоимость видеокарты + энергия. Грубо подсчитаем: в среднем без большой нагрузки они потребляют 100 ватт * 24 часа и на 30 = 72 kw/месяц, при цене 8 р. = 576 р. за месяц.

У автора - 1.23$, до оптимизации запросов.

Дело в нагрузке еще конечно, независимости, в том числе от необходимости использовать VPN для ChatGPT. И кто платит - частный домашний проект или бюджет организации.

Можете рассказать подробнее как это реализовали?

Точность 98% это конечно звучит очень хорошо. Но если скоррелировать с реальностью, то из 1000 сообщений, 20 сообщений от нивчём неповинных людей. Вроде бы мало, а вроде 20 человек.

С такими показателями рано чатботов привлекать к судейству )

Но для чата, наверное сойдёт.

В статье же написано: 9 ложных срабатываний)

Да, но я исхожу из того, что это 9 человек из чата неожиданно расстроились, что их сообщения удалили. Если сообщения удаляются вручную (я может пропустил это в статье) то тогда норм, если же все удаляет бот, то потенциально минус 9 подписчиков.

Нет, удаляет бот. Каждый день приходят десятки спам-сообщений, и для ручной модерации пришлось бы мониторить чат круглосуточно.

Да, 9 человек могли расстроиться (хотя бот присылает им обоснование для удаления). Но зато рады остальные 3991, которым не приходится ежечасно читать спамерские сообщения.

2% от 4000 человек, это все же 80 человек, а не 9.

А 80- звучит уже серьезно.

Но отчасти я согласен.

Вы все же прочитайте статью, а заодно и мой комментарий. Там написано, что из 4000 человек только 9 человек попали на ложное срабатывание. Там НЕ написано, что все эти 4000 человек писали в чат. Там написано, что 4000 человек подписаны на канал. Подписаться - не значит писать туда.

В телеграм чатах с несколькими тысячами людей пишут обычно не больше 2 десятков. Всего а не за день.

Сижу в одном чате с такой же проблемой, туда добавили бота, теперь в итоге от бота оповещений больше чем от спамеров, приходится чат мутить постоянно. Мб в лс писать нарушителям а не в общий чат?

Разве телеграм-боты имеют права писать пользователям, не отправившим им команду /start?

У тг-ботов вроде есть функция отправки сообщения в чат без звукового уведомления.

Так же можно не генерировать новое сообщение о блокировке спама, а редактировать какое-то специально закрепленное сообщение для этого, все равно ложных срабатываний мало, всем от этого только легче станет

Спасибо, это надо попробовать)

Вот бы ещё спамерские звонки как-то блокировать. Я ничего умнее не придумал, как блокировать всех, кого нет в контактах.

Блокировщик звонков от Яндекса не пробовали? Мне помогает.

Не пробовал. Посмотрю, что это такое.

Репозиторием не поделитесь?

Ну как же тут не вспомнить классику...

*** Now talking in #christian
-Word_of_God- Welcome Abstruse to #christian I am a Bible Bot.
For more info type: /msg Word_of_God !info
!kjv numbers 22:21
Numbers 22:21 -- And Balaam rose up in the
morning, and saddled his ass, and went with the princes of
Moab. - (KJV)
*** SageRider sets mode: +b
!
@c211-30-208-111.rivrw3.nsw.optusnet.com.au
*** Word_of_God was kicked from #christian by SageRider
(Please dont Swear)

Надеюсь, у вас тоже найдутся весёлые применения боту.

Проанализируйте ложные срабатывания и пропишите в промпт фильтр исключений.

Также в случае спорных моментов можно сделать опцию передачи комментария на ручную модерацию без удаления.

Также можно добавить дополнительную проверку контекста комментария попавшего под первый фильтр относительно поста в канале + анализировать предшествующий диалог, а не отдельные посты.

Это повысит точность, но и цена будет выше 1 доллара. Сейчас Ваш бот на уровне "модератора-школьника", который вроде бы может формально справляться с рутиной, но подтупливает.

И вопрос: а как справились со спамерами, которые пишут фразы вроде "хорошая статья", "я с вами согласен" и т.п. Но в их профиле уже стоит спам ссылка?

Спасибо за советы, надо обдумать! Да, не мешало бы добавить третью градацию: "спам", "не спам" и "сомневаюсь" с пересылкой третьего варианта кому-нибудь из модераторов в личку.

Поддержку контекста я делала для другого своего бота @findplantbot. Цена в целом не сильно вырастает. Но в данном случае контекст не играет большой роли. ChatGPT и без него вычисляет спам удивительно точно. Я бы не назвала точность 98% уровнем школьника.

Но в их профиле уже стоит спам ссылка?

Они пока не приходили. Решаю проблемы по мере поступления.

Добавьте, чтобы банились субъекты, пропагандирующие альтернативные мировоззрения :) Меня бот так и не забанил, я сам решил прекратить участие в чате :)

Ну в теории против подобных ботов можно выставить 2 вида защиты, не обязательно даже текст самого сообщения проверять

Можно проверить нсфв фильтром аватарку спам бота а так же узнать название канала в его биографии и уже пропускать его через того же чатгпт

Sign up to leave a comment.

Articles