Как стать автором
Обновить

Телеграм бот для удаления спама

Время на прочтение3 мин
Количество просмотров120K

UPD: Актуальная документация по боту находится по адресу https://tgdev.io/bot/daysandbox_bot


Решил написать эту публикацию т.к. устал объяснять одно и то же людям, которые хотят использовать моего телеграм бота @daysandbox_bot. Итак, несколько месяцев назад я разработал бота для удаления спама по очень простому признаку: если человек зашёл в чат и провёл в нём менее суток, то любые ссылки или forward сообщения от этого человека удаляются. Всё. Никаких нейронных сеток, анализа частотности, модерируемых white- и black-листов и прочих сложных вещей. На удивление бот приобрёл некоторую популярность и работает уже более чем в шестистах чатиках. Далее я попытаюсь развёрнуто описать принцип работы бота, чтобы в дальнейшем давать ссылку на эту статью.


Принцип работы бота


С момента добавления в чат бот отслеживает события захода новых пользователей в группу и тем самым знает, когда кто зашёл в чат и сколько времени он уже провёл в чате. В силу ограничений telegram API я не могу узнать, когда к чату присоединились те пользователи, которые уже были на момент добавления бота в чат. Бот никак не анализирует сообщения от пользователей, существующи на момент добавления бота. Итак, бот знает, когда новые пользователи зашли в чатик. Если бот видит, пользователь провёл в чате меньше суток и запостил сообщение, удовлетворяющее определению спама, то бот удаляет такое сообщение. Он не банит пользователя, не ставит ему read-only права, бот просто удаляет сообщение со спамом. Если пользователь запостит не-спам сообщение, то оно будет опубликовано. Какие сообщения считаются спамом? Во-первых, любые сообщения содержащие ссылку: URL, email или username. Во-вторых, любые forward-сообщения т.е. сообщения пересланные из другого чата. Для правила username есть исключение, если username ссылается на пользователя, то такое сообщение разрешается. Бот удаляет только те сообщения с username, которые ссылаются на группу или канал. Это сделано для того, чтобы не было ложных срабатываний, когда новый пользователь просто пытается обратиться к какому-то участнику чата по его username.


Что бот daysandbox_bot НЕ делает


  • Бот не банит никого и никогда
  • Бот никак не фильтрует сообщения от тех участников чата, что уже были в чате на момент добавления бота
  • Бот фильтрует сообщения только тех пользователей, которые провели в чате менее суток. Если пользователь провёл в чате больше суток, его сообщения никак не обрабатываются ботом
  • Бот никак не анализирует текст сообщения, он просто удаляет сообщения со ссылками. Всё.

Как правильно добавить бота в чат


Описываю алгоритм для desktop клиента. Подразумевается, что вы админ чатика и можете добавлять в него других админов.


  • Заходим в чатик, кликаем на название чатика сверху
  • В открывшемся окне сверху справа от надписи "Информация о группе" кликаем на иконку из трёх точек
  • В открывшемся меню кликаем на "Управление группой"
  • В открывшемся меню кликаем на "Администраторы"
  • В открывшемся окне снизу кликаем на "Добавить администратора"
  • В открывшемся окне в строке поиска вводим daysandbox_bot
  • В обновившихся результатах поиска кликаем на DaySandBox бота, у него должна быть жёлтая иконка пакмэна.
  • В открывшемя окне выставляем боту права на удаление сообщений, все остальные права отключаем.
  • Жмём "Сохранить"

Настройки бота


У бота есть несколько настроек.


Напишите в чатик /daysandbox_set safe_hours=N для задания времени, в течении которого сообщения новых пользователей анализируются на признаки спама. По-умолчанию, этот период равен суткам. Вы можете указать количество часов от нуля до 8760 (один год). Период равный нулю часам по сути деактивирует бота.


Напишите в чатик /daysandbox_set publog=yes чтобы разрешить боту писать сообщения в чат о том, что сообщение какого-либо пользователя было удалено. По-умолчанию, бот именно это и делает.


Текущие значения этих двух настроек можно получить командой /daysandbox_config.


Немного статистики


Мне лень рисовать красивые графики, скажу лишь, что бот за день бот удаляет от 10 до 15 тысяч сообщений и работает более чем в 600 чатиках.


Open Source


Исходники бота находятся в открытом доступе на github.
UPD (11 февраля, 2019): на данный момент в репозитории находятся исходники устаревшей версии бота. Исходников актуальной версии бота я не предоставляю.


Другие мои боты


Возможно, вас заинтересуют другие боты, которых я разработал. С полным списком ботов вы можете ознакомиться на сайте https://tgdev.io


Контакты для связи


Группы для обсуждения моих ботов:



UPD: Актуальная документация по боту находится по адресу https://tgdev.io/bot/daysandbox_bot

Теги:
Хабы:
Всего голосов 25: ↑19 и ↓6+13
Комментарии13

Публикации

Истории

Ближайшие события

AdIndex City Conference 2024
Дата26 июня
Время09:30
Место
Москва
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область