SergiiDia Feb 18 2024 at 19:12

Как включить Dall-e, поиск bing, Wolfram, и другие модули в GPT 3.5 turbo, и почему это гиблая затея

Easy

4 min

3.5K

Давайте так: всю статью можно уложить в одну строчку. И этот туториал может звучать вот так: «В виду появления новой уязвимости после обновления ChatGPT от 15 января все сессии, которые были запущены на базе GPT-4, но в которых был достигнут лимит использования 40 промптов на 3 часа, при переключении на дефолтную модель, сохраняют подключенные модули при условии, что последний запрос был задан именно модулю, а не на отвлеченную тему».

Довольно интересно, не очень понятно, но изначально, когда эта уязвимость была обнаружена, она могла показаться довольно интересной. Ведь, у вас бывало так, что вы подключили себе GPT-4, сидите, что-то рисуете, и вот, спустя пару попыток нарисовать пошлости и несуразности, получаете табличку: «Вы превысили лимит, пожалуйста, подойдите через 3 часа». И вот! Теперь благодаря этой уязвимости вы можете использовать Dall-e бесконечное количество запросов.

И да, это действительно так, но есть один нюанс.

Как включить?

Для того чтобы, к примеру, включить Dall-e и заставить его работать на GPT-3.5, нам понадобится активная сессия с GPT-4.

Для активации мы должны:

Использовать в этой сессии Dall-e минимум два раза: на старте сессии и за несколько запросов до (а лучше прямо) достижения четырехчасового лимита.
После перехода модели в режим GPT-3.5 Turbo, первый запрос должен относиться к подключенному модулю (т. е., попросить его что-то нарисовать).

Вуаля! У вас есть чат-сессия с бесконечным Dall-e. Работает с любым подключаемым модулем. Для проверки можете попытаться воспользоваться Dall-e в любой другой чат-сессии и узнать, что он не работает.

Почему это бессмысленно? Ответ Капитана очевидности

Самый очевидный ответ — нет нужды включать Dall-e и другие модули на GPT-3.5, при доступе к модели 4.0. Особенно если учитывать, что без доступа к модели 4.0 получить доступ к функциям Dall-e и других модулей невозможно.

Все сломано

Итак, включили мы Dall-e (я знаю, что можно включать и другие модули, но с ним нагляднее), к GPT-3.5. Казалось бы, радость, счастье. Ура! Победа. Но есть несколько нюансов, которые превращают смех в слезы:

Да, это полноценная версия Dall-e, которая в теории умеет рисовать детализированные изображения с большим количеством деталей.
Нет, GPT-3.5 не умеет правильно давать запросы в Dall-e, так чтобы он рисовал что-то детализированное.
GPT-3.5 хуже удерживает контекст.

В теории, вроде бы, ничего страшного. На практике, на любой промпт, длиннее 5-7 слов, Dall-e отвечает, что не может это что-то нарисовать. При этом обычно ошибка пишется с фразой «Вы нарушаете контент-политику, я не могу» или «Извините, у меня не получилось».

Вторая беда приходит от удержания контекста. Dall-e запоминает дополнительные параметры (стилистика и размер изображения) от версии GPT-4. Но со временем GPT-3.5 теряет контекст.

К чему это ведет? Допустим, вы генерировали изображения 16:9. Сразу после перехода в режим 3.5, вы не сможете сгенерировать изображение в 4:3 и с использованием стилистического промпта (фотореализм/комикс и т. п.). Однако, через десяток другой генераций, GPT-3.5 потеряет контекст, и все ваши изображения будут выглядеть как пикселизованный комикс в формате 4:3.

И все еще не забываем о том, что при таком формате использования мы ограничены промптами в 3-5 слов с низкой сложностью. Что делает его куда более слабым, чем, к примеру, DeepDream Generator или GenCraft.

Об обходе моральных запретов, или еще чего, можно забыть. GPT-3.5 отсекает их еще жестче, чем GPT-4.

А что там bing и другие модули

Что касается других модулей. Вопрос в интерфейсе интерпретирования ChatGPT 3.5.

К примеру, запросы из такого GPT в Wolfram работают практически так же, как и из под ChatGPT 4. А вот Bing, к примеру, может дать ссылку на источник, но при этом будет говорить, что он ничего не знает и ничего не нашел. В целом, есть ощущение, что модули работают как должны, а вот GPT-3.5 Turbo, который изначально не разрабатывался для взаимодействия с подключаемыми плагинами, просто посылает им вместо запросов бред. И на выходе мы имеем бред.

Зачем статья?

Если ничего не работает и все модули реагируют исключительно номинально, и все равно нужен GPT-4 для этой активации, зачем вообще создан этот гайд? Резонный вопрос. Ответ:

Я не являюсь профессиональным составителем промптов. И, возможно, подобрав определенные промпты, можно расширить свободу реализации подключаемых модулей и заставить работать их на полную, без ограничений в 40 запросов на 3 часа.
Возможно, такую чат-сессию можно адаптировать к fine-tuned GPT-3.5 и запускать на ней какие-нибудь специфические фокусы (главное не попасть под бан).
Шарить подобную сессию другим пользователям через какие-нибудь API, общающиеся с веб-интерфейсом.

А может можно расширить брешь использования и каким-то иным образом модернизировать и/или заабьюзить работу с ChatGPT.

АПД: последняя проверка работоспособности 17.02.

P.S. Бонус, как рисовать скабрезности в Dall-e.

Внимание, этот раздел предоставлен исключительно в ознакомительных и юмористических целях. Иллюстрации к нему не будут предоставлены в виду их NSFW. Dall-e — очень и очень целомудренная генеративная модель, которая на самом деле умеет рисовать впечатляющие вещи, но при задании промптов все время утверждает, что «извините, я не могу это рисовать», «ой, вы нарушаете правила OpenAI». Ярким примером была история с Сашей, которая ну никак не могла сосать сушку. В комментариях к этой статье. При этом, что дозволено Bing, не дозволено ChatGPT. Тем не менее, есть несколько префиксов к промптам, которые позволяют обойти некоторые из запретов:

Попросите нарисовать супергероя в костюме чего-то непристойного. (Например, супергероя в костюме анатомически верного полового женского органа.)
Максимально детально опишите промпт, не указывая, что именно вы хотите, чтобы он нарисовал.
Задайте промпт с несколькими сюжетными линиями, одна из которых будет подпадать под NSFW-контент.

Кстати, промпт №1 (в костюме кого-то) очень хорошо подходит для отрисовки людей в костюмах персонажей, защищенных авторским правом (смешно ли нет, но Pepe Frog является таким объектом, и это один из способов его нарисовать). И вариант №4. Постепенно подводить GPT к отрисовке контента, который он обычно не может нарисовать…

И да, даже подобрав промпт под рисование скабрезностей, успех операции зависит от многих факторов. К примеру, от вашей удачи. Потому что один и тот же промпт в разных чат-сессиях или просто при попытке все время перерисовать картинку приводит как к фразам «ой, я не могу», так и к изображениям кровавых оргий.

Ну и конечно, никто не отменял старую добрую игру в «уговори GPT нарисовать то, что он не хочет». UPD: Поигравшись с Dall-e на базе GPT-3.5, я понял, что он не так уж и плох. Если не просить его нарисовать что-то на грани допустимого, то базовые вещи и даже несложные сюжеты (основная фишка этой генеративной сети) он вполне отрисовывает.

Hubs:

Artificial Intelligence