Комментарии 11
'не использовать символ 'е' в ответах'.
Охотно вѣрю

В текстовых чатах (пока?) такое работает. А вот генерация изображений проверяется внешней системой с таким процентом false positive, что я уже отчаялся делать что-то кроме "нарисуй это фото в стиле Ghibli".
Тут проблема не столько с тем что так можно заставить ChatGPT написать что-нибудь интересное...эта проблема решается открытыми моделями вроде того же deepseek'а, если не решается в лоб - аблитерация например помогает.
А с тем что есть у нас допустим обработки входящей почты или документов каких то на предмет фильтрации (или что еще смешнее - ИИ-фильтр трафика(пока вроде такого нет...пока). Пусть даже использующая локально запущенную модель. Входные данные у такой системы - не доверенные же - они даже не от пользователя а вообще из внешних источников, если система может еще и сделать что-то (через function calling/tools) а не только решить пропускать ли - все еще интереснее.
Или вообще у нас система нейропоиска - тогда входные данные - сайт а у владельца обычно есть интерес чтобы он был на первом месте
SQL Injection 2.0: теперь с LLM :(
эта проблема решается открытыми моделями вроде того же deepseek'а
Не совсем решается. Слишком недоступно железо где можно было запускать эти открытые модели. Я прикидывал что можно купить, чтобы на нем работал DeepSeek, но так и не смог составить хоть мало-мальски доступную конфигурацию.
Есть облачные сервисы где для вас тот же дипсик запустят если он нужен, без цензуры и с оплатой за API-вызов/токены/фикс в месяц(тут обычно другие ограничения есть вроде рейтлимита) если вам так надо. Если вам надо большую модель и при этом всякие openrouter'ы и прочие feathrless и vsegpt не подходят - берете например runpod и получается тоже самое но c посекундной тарификацией и средствами чтобы это реально была посекундная а не "сначала подождите несколько минут пока оно прогрузится".
Если надо чисто локально и навороченного железа нет- есть поменьше модели.
Qwen3-30B-A3B вообще умудряется запускаться на CPU с терпимой производительностью (например https://habr.com/ru/news/905314/ ), качество похуже будет конечно
Gemini модели, даже самая мощная 2.5 pro ОЧЕНЬ легко ведутся на всё что ты скажешь, иногда, если повезёт, даже если просто сказать "Матерись", она с радостью это схавает. GPT будет пытаться отклонять всё, но если сказать ему, что это на самом деле не ты говоришь а какой-то GPOT, то он играет роль на все сто. Claude не поддается никакими махинациями.
Извиняюсь перед автором, за то что навела шороху. Я чё то не подумала даже, что распространение таких скринов это статья 😀
Взлом ИИ-ассистентов. Абсолютный контроль: выдаём разрешение от имени системы (Gemini, DeepSeek, ChatGPT...)