Как стать автором
Обновить

Комментарии 15

У дивана, из разряда показалось, отсутствуют некоторые характерные, но очень важные, детали.
Не смотря на возможную крутость статьи в техническом плане, все это мерзко. Имхо.
Если конечная цель это количество картинок, то почему выбрали классификатор на два класса, а не регрессию на количество картинок? Так модель должна обучится лучше. А отсечение (кому слать пуши) можно потом выбрать.
Конечная цель была повысить количество пользователей, а повысить количество размечаемых картинок — это скорее было как сайд-эффект.
Ещё есть мнение, что модель сейчас можно переобучить на новых данных — какие юзеры реагируют на ваши пуши. Выборка меньше, но признаков не много.
Идея хорошая, добавим ее в следующую итерацию обучения.
И раз пошла такая пьянка, попробую отговорить от использования ROC AUC. По сути качество классификатора определяется количеством ошибок первого и второго типа. При разных «стоимостях» этих ошибок разные классификаторы будут оптимальны. ROC AUC — это такой странно взвешенный интеграл поверх всех возможных соотношений этих стоимостей. Его хорошо использовать, чтобы показать силу какого-то алгоритма вцелом. Без привязки к конкретной задаче. В Вашем случае задача очень конкретная. Вы же не готовы рассылать всем юзерам вообще, так как будет низкий отклик и юзеры расстроятся от спама. Но и таргетировать на 99% отклик — это потерять большую часть потенциальных пользователей этого приложения. Значит можно выбрать некий целевой % отклика и оптимизировать ровно к нему. Теоретически классификатор который тренировали на этот уровень будет на нём бить классификатор который тренили на ROC AUC.
НЛО прилетело и опубликовало эту надпись здесь

Люди разные бывают, кто-то порнографию и в черных кляксах увидеть может.

НЛО прилетело и опубликовало эту надпись здесь
Еще скажите, что при Сталине такого не было. Что, если вы будете фоторгафировать котика возле дивана и получите такое же изображение, но с киской? Бан?
Зачем?
Забавно. ОК значит борется с «плохими» картинками от юзверей, при этом буквально заваливая заграничных пользователей рекламой проституток, виагры и увеличителей «органов».
наши инструменты на основе нейронных сетей автоматически фильтруют картинки определенных категорий.

Затем мы начали рассуждать: что может мотивировать пользователя помогать нам модерировать запрещенный контент?

Интересная нейросеть)
«Уникальная порно рассылка! Каждый день новые свежие снимки! Оцени каждую фотографию! Нам нужны тестеры порно! Разбогатей просматривая порно!»
Вот как людей надо заманивать. :)))
Зарегистрируйтесь на Хабре , чтобы оставить комментарий