Comments 29
Для того же самого используем локальную gemma3-4b для отсеивания спама на почте. Раньше справлялся штатный спам-фильтр, но рекламщики стали креативней и фильтр справляться перестал. Не в последнюю очередь, видимо, из-за того, что на помощь рекламщикам пришли нейронки. Ну и мы себе в помощь одну пристроили и нормально. Крутится локально, по затратам практически бесплатно
А на каком железе она у вас живет?
На rtx 2060 super, купленной на авито 😅, занимает половину видеопамяти, оставшуюся заняли нейротранскрибатором
хм, она разве видео кушает? я когда в скрепыше ставил ее и смотрел, в основном оперативку только кушало, и работала очень быстро
Вряд ли "практически бесплатно". Стоимость видеокарты + энергия. Грубо подсчитаем: в среднем без большой нагрузки они потребляют 100 ватт * 24 часа и на 30 = 72 kw/месяц, при цене 8 р. = 576 р. за месяц.
У автора - 1.23$, до оптимизации запросов.
Дело в нагрузке еще конечно, независимости, в том числе от необходимости использовать VPN для ChatGPT. И кто платит - частный домашний проект или бюджет организации.
Можете рассказать подробнее как это реализовали?
Точность 98% это конечно звучит очень хорошо. Но если скоррелировать с реальностью, то из 1000 сообщений, 20 сообщений от нивчём неповинных людей. Вроде бы мало, а вроде 20 человек.
С такими показателями рано чатботов привлекать к судейству )
Но для чата, наверное сойдёт.
В статье же написано: 9 ложных срабатываний)
Да, но я исхожу из того, что это 9 человек из чата неожиданно расстроились, что их сообщения удалили. Если сообщения удаляются вручную (я может пропустил это в статье) то тогда норм, если же все удаляет бот, то потенциально минус 9 подписчиков.
Нет, удаляет бот. Каждый день приходят десятки спам-сообщений, и для ручной модерации пришлось бы мониторить чат круглосуточно.
Да, 9 человек могли расстроиться (хотя бот присылает им обоснование для удаления). Но зато рады остальные 3991, которым не приходится ежечасно читать спамерские сообщения.
2% от 4000 человек, это все же 80 человек, а не 9.
А 80- звучит уже серьезно.
Но отчасти я согласен.
Вы все же прочитайте статью, а заодно и мой комментарий. Там написано, что из 4000 человек только 9 человек попали на ложное срабатывание. Там НЕ написано, что все эти 4000 человек писали в чат. Там написано, что 4000 человек подписаны на канал. Подписаться - не значит писать туда.
Сижу в одном чате с такой же проблемой, туда добавили бота, теперь в итоге от бота оповещений больше чем от спамеров, приходится чат мутить постоянно. Мб в лс писать нарушителям а не в общий чат?
Разве телеграм-боты имеют права писать пользователям, не отправившим им команду /start?
Правильный бот может отправлять сообщения без оповещений - https://core.telegram.org/method/messages.sendMessage Смотри параметр silent
Вот бы ещё спамерские звонки как-то блокировать. Я ничего умнее не придумал, как блокировать всех, кого нет в контактах.
Репозиторием не поделитесь?
Я думала, что весь основной код и так есть в статье. Вот здесь одна из последних версий: https://github.com/AstFreelancer/ioanno_bot
Ну как же тут не вспомнить классику...
*** Now talking in #christian
-Word_of_God- Welcome Abstruse to #christian I am a Bible Bot.
For more info type: /msg Word_of_God !info
!kjv numbers 22:21
Numbers 22:21 -- And Balaam rose up in the
morning, and saddled his ass, and went with the princes of
Moab. - (KJV)
*** SageRider sets mode: +b !
@c211-30-208-111.rivrw3.nsw.optusnet.com.au
*** Word_of_God was kicked from #christian by SageRider
(Please dont Swear)
Надеюсь, у вас тоже найдутся весёлые применения боту.
Проанализируйте ложные срабатывания и пропишите в промпт фильтр исключений.
Также в случае спорных моментов можно сделать опцию передачи комментария на ручную модерацию без удаления.
Также можно добавить дополнительную проверку контекста комментария попавшего под первый фильтр относительно поста в канале + анализировать предшествующий диалог, а не отдельные посты.
Это повысит точность, но и цена будет выше 1 доллара. Сейчас Ваш бот на уровне "модератора-школьника", который вроде бы может формально справляться с рутиной, но подтупливает.
И вопрос: а как справились со спамерами, которые пишут фразы вроде "хорошая статья", "я с вами согласен" и т.п. Но в их профиле уже стоит спам ссылка?
Спасибо за советы, надо обдумать! Да, не мешало бы добавить третью градацию: "спам", "не спам" и "сомневаюсь" с пересылкой третьего варианта кому-нибудь из модераторов в личку.
Поддержку контекста я делала для другого своего бота @findplantbot. Цена в целом не сильно вырастает. Но в данном случае контекст не играет большой роли. ChatGPT и без него вычисляет спам удивительно точно. Я бы не назвала точность 98% уровнем школьника.
Но в их профиле уже стоит спам ссылка?
Они пока не приходили. Решаю проблемы по мере поступления.
Ну в теории против подобных ботов можно выставить 2 вида защиты, не обязательно даже текст самого сообщения проверять
Можно проверить нсфв фильтром аватарку спам бота а так же узнать название канала в его биографии и уже пропускать его через того же чатгпт
Как ChatGPT удалил в нашем чате 555 спам-сообщений с точностью 98,38%