Подразделение Google Jigsaw разработало Harassment Manager — инструмент для фильтрации негативного контента в соцсетях. Инструмент, предназначенный для журналистов и других общественных деятелей, использует API-интерфейс Jigsaw Perspective, позволяющий сортировать потенциально оскорбительные комментарии. Google опубликовала код инструмента, а в июне выйдет приложение на его основе.
В Twitter Harassment Manager позволяет скрывать ответы и блокировать аккаунты после проверки твитов на угрозы, оскорбления и ненормативную лексику. Инструмент сортирует сообщения на панели инструментов, где пользователи могут обрабатывать их партиями, а не по отдельности с помощью стандартных инструментов модерации. Harassment Manager также дает возможность формировать отчеты по оскорбительным постам и сообщениям для работодателя или, в случае незаконного контента, такого как прямые угрозы, для полиции.
Jigsaw объявила о выпуске Harassment Manager в Международный женский день и назвала этот инструмент особенно актуальным для женщин-журналисток, сталкивающихся с оскорблениями по признаку пола. Команда надеется, что разработчики смогут адаптировать его для других находящихся в группе риска пользователей социальных сетей, включая активистов, политиков и других общественных деятелей.
Google уже использовала Perspective для автоматической модерации. В 2019 году компания выпустила расширение для браузера под названием Tune, которое позволяет скрывать предположительно токсичные сообщения. Расширение использовалось многими платформами, включая Coral от Vox Media, в дополнение к модерации людьми.
В отличие от Tune, Harassment Manager не является инструментом модерации. Это инструмент сортировки, помогающий быстрее и эффективнее работать с большим количеством постов и ответов в социальных сетях.