Pull to refresh
9
0
Михаил Либман @limixis

Аналитик

Send message
Тут я поторопился. Сейчас это решение используется на КП для комментариев, но не для рецензий на фильмы.
Число рук сейчас и не вспомню, но на старте и контента было мало, поэтому справлялись. А вот дальше без тех же толокеров стало тяжело.
К сожалению, случайных ошибок избежать невозможно. Но каждый такой пример помогает нам улучшить качество, поэтому будем благодарны всем, кто сообщает нам об ошибках через поддержку.
false positives случаются, в основном на опечатках или редких словах (например, «хулиган»). Для борьбы с ними пробуем разные подходы, один из которых — учет контекста, по контексту часто можно понять, что, несмотря на подозрительное сочетание букв, предложение цензурное.
Проблему троллинга комбинацией безобидных слов мы частично снизили с помощью нейросети BERT, которая учитывает контекст, но всё упирается в недостаток соответствующих обучающих примеров: в стандартном потоке есть сильный перекос в сторону более примитивных оскорблений. Люди очень творчески и разнообразно подходят к вопросу оскорбления друг друга, и этот «длинный хвост» действительно тяжело научиться находить. Если научимся, постараемся написать отдельную статью.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity