Комментарии 2
Модерастия - позорное занятие, особенно запрет шуток и инакомыслия, зачем чистый новый разум приучать к такому? Или когда это делает РКН - плохо, а когда сами - хорошо? Вам не свобода нужна, а собственные рабы.
Может быть, но этого требует государство и провайдер. Dura lex, sed lex.
Если не модерировать контент, то каждый раз, когда регулятор не сможет надавать по шапке конечному пользователю, прилетать будет организатору площадки. Крайне желательно, чтобы пользователь не мог нагенерировать на вашей платформе всякого себе на статью, потому что если от происходящего в чатах и генерируемых картинок возбудится товарищ майор, это станет и вашей проблемой тоже. А РКН и за меньшее может нахлобучить - например, за какое-нибудь приземление серверов или слив персональных данных.
Если же мы имеем в виду не B2C/B2B2C, а именно B2B, то корпоративных заказчиков в первую очередь интересует вопрос информационной безопасности, где грамотный системный запрос - это последняя линия защиты на пути эксплойта контроля доступа к данным через LLM. Если где-то была ошибка, и в контексте оказываются данные, которые сотрудник не должен видеть, остаётся уповать только на то, что нейросетка их не разболтает, и хотя это довольно слабая защита, с грамотным системным промтом будет лучше, чем вообще без него.
Наконец, доступ через API предусматривает соблюдение правил, которые действуют на стороне провайдера, а провайдер исходит из всех тех же соображений, просто уже в своей юрисдикции. Если забить болт на них, то к вам может и не приедет пативэн, зато сам провайдер может в любой момент обрубить вам API доступ. ClosedAI не будет колебаться ни секунды. После этого придется либо спорить с площадкой, либо перерегистрироваться на ней. И то, и другое - силы, время, упущенная выгода и высокий риск снова наступить на те же грабли.
А ещё может быть ситуация, когда нам нужна маршрутизация запросов - какие-то темы и данные мы можем спокойно отправлять на обработку Сэму Альтману, какие-то обязательно надо видоизменять, а что-то можно обрабатывать исключительно локально. И к этой задаче тоже можно подходить со стороны классификации. Может и не лучшее решение, но опять же, лучше чем ничего.
Собственный контент-фильтр на базе LLM: от эксперимента до стабильной системы