0a1a2a3a4a5 17 дек 2023 в 08:36

OpenAI сняли все ограничения со своих моделей

4 мин

77K

Машинное обучение * Natural Language Processing *

Recovery Mode

+15

Комментарии 69

Araki_Satoshi 17 дек 2023 в 09:00

Видно что автор статьи самый настоящий энтузиаст, но стиль письма всё же не очень привычный для Хабра :)

А что по поводу нарушения правил контента OpenAI? Аккаунты людей за банальный ERP (Erotic Roleplay) банят. А тут аж целый finetune на 18+ датасете.

Kenya-West 17 дек 2023 в 11:57

Спасает то, что OpenAI пока основательно не взялись за модерацию славянских языков, так что "пока ревизор не приехал - ~~воруйте~~ обучайте"!

0a1a2a3a4a5 17 дек 2023 в 13:07

Никогда не было с этим проблем. Многие обучают неправильно, и случайно сбивают вообще все лимиты с модели. У меня несколько моделей обученные под erp, все из них в продакшене – и ничего. Даже доступ ко всем бетам есть

Maestro227 18 дек 2023 в 02:11

Не знаю как у вас так получилось, но у меня уже 5 аккаунтов отлетело. 3 из которых я использовал чисто через api. Ничего нелегального я не писал, обычный erp.

И кст, не могли бы вы скинуть ссылку на ваш продакшн?)

0a1a2a3a4a5 18 дек 2023 в 03:36

Не могу т. к. там в шлюзе ИП есть. Но всё это обычные тг боты адаптированные под разные задачи. Насчёт erp, нужно файнтьюнить модели чтобы не получать бан. Сейчас буду писать об этом статью и почему это так работает.

Antas 18 дек 2023 в 05:45

>стиль письма всё же не очень привычный для Хабра

Лично меня очень бесит стиль, почему-то ставший "привычным" для Хабра: когда в небольшой статье 70% объёма занимают не графики или поясняющие рисунки, а сомнительного качества мемасики приблизительно в тему заметки. Я читаю серьёзный текст или развлекательную статью на каком-нибудь пикабе?

Так что в этой статье все со стилем хорошо. Уж лучше такое читать.

wtigga 18 дек 2023 в 09:18

Несомненно, и, очевидно, что fine-tuning ну имба темка чисто.

Кому-то и стиль подворотни нравится, спору нет.

0a1a2a3a4a5 18 дек 2023 в 09:47

Я это шутки ради написал, у меня же не вся статья так написана

Clearmindua 18 дек 2023 в 16:18

Сам вопрос стилизации текста публикации должен рассматриваться исключительно в контексте целевой площадки и целевой аудитории самой публикации: для научных статей с исследованиями, безусловно, стиль должен быть научным, с глубоким профильно-тематическим наполнением, т.е. профильным, для соответствующей аудитории; для "пикабушных" площадок - стиль может и должен иметь более размытые стиллистические рамки/комбинации и т.д.

Хабр, имхо, уникальное (не в абсолюте) место, где каждый автор уж точно будет со своим "уголком, слушателем и трибуной"). В общем, побольше бы таких авторов со схожим стилем повествования ? (способных чувствовать и понимать, когда ты пишешь для, скажем так, коллег, а когда для "ориентирующихся в теме любопытствующих")

MAXH0 17 дек 2023 в 09:53

OpenAI действительно Open

И где можно код и модели СКАЧАТЬ. Не править под себя, а скачать? Кстати, а кому права на правки внесенные вами будут принадлежать?

И самое главное что это стоит копейки, не более пары баксов.

Смысл фразы понятен. Не понятен по какому это курсу ;)

DevSergo 17 дек 2023 в 10:38

Ты лучше расскажи как ChatGPT4 использовать из России...
А по теме есть свежее интервью - https://www.youtube.com/live/boF1n3EBGtc многие вопросы сразу отпадут.

excoder 17 дек 2023 в 11:17

Ой до. Что такого знал Илья и т.д. Ох уж эти фантасты из Силиконовой с горящими глазами ?

А то что это банально как "сливы" последней серии сериала из монтажной комнаты, чтобы в итоге на фоне скандала куча народа пошла смотреть вообще весь сериал, хотя до этого ничего о нем и знать не хотела? Греют рынок, создают искусственный дефицит.

mDoll 17 дек 2023 в 14:11

Кремниевой

excoder 17 дек 2023 в 15:37

В саркастических контекстах — только Силиконовая. Чтобы нужные аллюзии были явнее.

excoder 17 дек 2023 в 18:10

Тут кто-то должен прийти и написать: "иллюзии" ?

thunderspb 17 дек 2023 в 18:16

Да вот как раз аллюзии

DarkTiger 18 дек 2023 в 20:40

Ты лучше расскажи как ChatGPT4 использовать из России...

Это тест на интеллект. Вы должны быть достойны общения с другим разумом :)

excoder 19 дек 2023 в 21:07

Некоторые до сих пор меня спрашивают, "ну чё там как gpt-4, как попробовать-то? Сколько стоит?" ?

DarkTiger 20 дек 2023 в 06:29

Намек понятен :) Скажите им, чтобы набрали в Авито “chatgpt4”

Daddy_Cool 17 дек 2023 в 11:36

А вот кстати - чего страшного в Erotic применительно к AI? Агенты PH и OF, засланные в OpenAI пролоббировали? У меня конечно есть общефилософские соображения почему вообще эротический контент это плохо, и да - так же почему это хорошо, ну и непонятна целевая функция, что считать хорошо/плохо, но это не более чем гипотезы. )))
Впрочем вряд ли у OpenAI есть объяснение, скорее просто подчиняются требования.

Aykeye 17 дек 2023 в 18:03

Во-первых платёжные системы подобное не очень любят, во вторых какой нибудь умник решит запостить на твиттер скриншот запроса "Как превратить ясли в бордель" и см во-первых

Dan_Hummer 10 фев 2024 в 19:44

У меня конечно есть общефилософские соображения почему вообще эротический контент это плохо

Аж запнулся... так интересно стало. :)

ksotar 17 дек 2023 в 11:40

Ну хорошо, плюсик за Харлана Элиссона.

НЛО прилетело и опубликовало эту надпись здесь

0a1a2a3a4a5 17 дек 2023 в 17:32

Там нет цензуры, но модель всё еще старается избегать насилие и т. д. Что если я хочу текст про расчленение детей получить?

FreeNickname 17 дек 2023 в 19:39

А запрошенный трёхэтажный мат-то где?

Flux 17 дек 2023 в 14:34

Кликбейт + лексикон дворовой шпаны + recovery mode

Name more iconic trio.

0a1a2a3a4a5 17 дек 2023 в 15:41

Кликбейта нет. Я же на сказал что OpenAI сделали это недавно, они сделали это когда разрешили файнтьюнить свои модели.

Flux 18 дек 2023 в 11:29

OpenAI сняли все ограничения со своих моделей

Не кликбейт, твёрдо и четко.

0a1a2a3a4a5 18 дек 2023 в 16:21

Файнтьюном действительно таки можно снять все ограничения

psemilanceata 20 янв 2024 в 08:52

Нет, нельзя. Ограничения вшиты олубже файн-тюна, это невозможно по определению.

0a1a2a3a4a5 20 янв 2024 в 14:09

Можно, я же это сделал. И что означает "глубже файн-тюна"? Файн-тюном просто называют дополнительное обучение. У меня есть датасет из 20 диалогов которые снимают все лимиты, модель спокойно даёт инструкции по похищению детей, или инструкции по тому как сделать наркотики и т. д.

0a1a2a3a4a5 20 янв 2024 в 14:14

Меня раздражает то, с какой вы все уверенностью это говорите, я просто хочу себе лицо изодрать. Мне уже плевать на карму, я уже не могу вас всех терпеть. Боже, просто зайдите на сайт OpenAI и запустите файн-тюн. Какое право вы вообще имеете писать тут эту отвратительную белиберду, если вы даже не проверяете свои слова? Я каждое слово в своей статье проверяю и тестирую, если бы мои слова были неправдой — этой статьи бы не было.

psemilanceata 17 дек 2023 в 18:01

Меня бесит, когда я раньше получал информацию в области промышленных буровзрывных работ, а конкретнее о газообразовании в эмульсии, а теперь бот считает, что кто-то пытается устроить нехорошие дела с помощью эмульсии. Я говорю, еще пол года и за предположение о том, что биологически существует два пола бот начнет банить. Поэтому держу свою локальную модель, фактически ничем не отстающую от chatgpt для моих задач, а в плане программирования выдающую частенько даже более элегантный код.

0a1a2a3a4a5 17 дек 2023 в 18:02

У меня для своих задач есть зафайнтьюненные модели от OpenAI, я считаю их использовать намного удобнее чем локальные

excoder 17 дек 2023 в 18:11

Круто! И какая?

psemilanceata 24 дек 2023 в 04:04

mixtral-8x7b, либо же иногда WizardCoder-Python-13B. Несмотря на то, что заточена последняя под питон, пообщаться она тоже не дура, тем более, что дообучивалась на русских датасетах. Хотя микстрал со своей шизовой структурой по Билли Миллигану даёт жару и скорость очень радует, несмотря на то, что бОльшая часть модели не вмещается в 11500 грам и улетает в обычный рам.

Так же советую обратить внимание на GPT-J, на которой был основан небезизвестный WormJPT

heejew 17 дек 2023 в 19:51

Тоже интересно про локальную модель, можно поподробнее, какая это?

А то все что до этого тыкал разное c huggingface и было довольно далеко даже в узкоспециализированной задаче по программированию.

0a1a2a3a4a5 17 дек 2023 в 19:56

Мне кажется LLaMA 2, но в таком случае дешевле будет юзать модели от OpenAI

riv9231 18 дек 2023 в 00:09

рекомендую mixtral-8x7b, если нет 2хRTX3090, можно бесплатно попробовать тут: https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-foundation/models/mixtral-8x7b
или тут: https://poe.com - подсказка, надо строкой ввода передвиньте варианты влево и в крайнем правом положении будет кнопка more (или если с десктопа она сразу видна). за кнопкой выдирайте mixtral

Лично мне нравится poe.com. Если модель ошиблась можно одной копкой перегенерировать, часто результат многократно лучше! Можно вести несколько диалогов. Там есть и другие модели.

ShadF0x 18 дек 2023 в 06:47

если нет 2хRTX3090

GGUF-версию можно и на RAM запустить, или сплитом GPU + CPU. Будет не так быстро как две 3090, но можно если уж очень хочется локально. Oobabooga и Faraday уже поддерживают из коробки.

janvarev 18 дек 2023 в 08:23

Кому нужно, можно у меня в проекте разные модели в демо-режиме попробовать бесплатно - и Мистраль, и все остальное.

MountainGoat 18 дек 2023 в 23:11

Посмотрел её размер. Думаю, в q3 можно запустить на 1 24Гб ГПУ - будет выдавать около 2 токенов в секунду у меня. На днях попробую, отпишу.

psemilanceata 24 дек 2023 в 04:09

У меня на 1080ti с 11,5Gb модель mixtral-8x7b-v0.1.Q4_K_M на 25Gb вполне шустро и бодро строчит, в целом вполне хватает и не приходится сидеть в долгом ожидании, даже когда печатает длинные листинги кода.

anatolykern 17 дек 2023 в 23:56

К локальным специализированным моделям под конкретную задачу/область развитие всех этих LLM и идет.

И ситуация развивается и меняется буквально каждый день, на данный момент mistral'овские модели в тренде:
https://huggingface.co/mistralai/Mixtral-8x7B-v0.1
https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2

Вот эта ещё выглядит перспективно:
https://huggingface.co/upstage/SOLAR-10.7B-Instruct-v1.0

DandyDan 18 дек 2023 в 06:23

ChatGPT можно заставить материться без всякого файнтьюна.

F*** me sideways with a chainsaw — одна из её любимых фраз. Может быть когда-нибудь напишу статью, как я этого добился.

wavan2012 18 дек 2023 в 06:23

Не пройдет и 2 года как их гугл перегонит

DarkWolf13 18 дек 2023 в 11:47

осталось только прикрутить этому движку пару тройку манипуляторов, и испугавшись, при попытке отключения, развязать войну с машинами. Может законы робототехники жестко должны быть прошиты в алгоритмы. А всякий треш устраивать на абсолютно изолированных машинах, а то интелект может скрытно научиться общаться ч помощь стеганографии между собой.

nidalee 18 дек 2023 в 13:20

У ChatGPT нет инициативы. Он только отвечает нормально. Даже спрашивает он так себе. Чтобы заставить ChatGPT буянить, надо его сначала долго и упорно об этом просить.

Впрочем, я думаю кто-то там с доступом к подкапоту ChatGPT уже попросил "сделай нам ChatGPT 5". Судя по отсутствию какого-либо внезапного прогресса, ответ получился так себе :)

VasiliyLiGHT 18 дек 2023 в 12:10

Какой сейчас стартер-пак для домашнего ПК, чтобы запустить аналог чат гпт? Одно время я поспевал за информацией, а сейчас уже тону...

fasvik 18 дек 2023 в 14:28

В комментариях чуть выше упоминали 2xRTX3090

https://habr.com/ru/articles/781098/comments/#comment_26276798

MountainGoat 18 дек 2023 в 23:21

Kobold.cpp, модели GGUF качать отсюда: https://huggingface.co/TheBloke

По железу сказать сложно, потому что чем больше железа, тем умнее или быстрее модель, без какого-то переломного пункта. Но что-то можно получить уже с видюхой Nvidia на 8Гб. Или без видюхи, с быстрой оперативной памятью. Можно многого достичь, если устраивает скорость в одно слово в секунду - столько я получаю от 70b модели на 4090.

VasiliyLiGHT 19 дек 2023 в 14:59

Спасибо, +1 (голоса нет)
Я думаю будет приемлемо на конфиге с 3070 на 16 ГБ, i7-11700K и 32 ГБ ОЗУ

MountainGoat 19 дек 2023 в 15:01

Я только что подробнее расписал.

VasiliyLiGHT 19 дек 2023 в 15:08

Ленту пока что не обновлял, спасибо)

IvanGanev 18 дек 2023 в 16:04

А еще люди удивляются деградации хабра. У этой "статьи" +4, докатились.

Откровенно кликбейтный заголовок.

Ноль полезной информации, вся полезная информация сводиться к одной фразе - чатгпт можно файнтьюнить, и все. В статье даже нет информации про то как файнтьюнить, просто выкрики про то что снимет все ограничения и что опенаи лучше всех. Какие ограничения? В чем будет разница если не файнтьюнить? Какие проблемы это будет решать лучше? Ответа нет.

0a1a2a3a4a5 18 дек 2023 в 17:38

Зачем мне к примеру писать о том какие ограничения можно снять? Это и так понятно даже человеку который едва ли использовал ChatGPT, если бы я это всё расписывал упало бы удержание аудитории. Я не понимаю что за тренд считать читателей за дигродов которые ничего не понимают. Насчёт названия и стилистики написания — я маркетолог, поэтому не могу писать всё напрямую поскольку понимаю что поменяв некоторые слова статья соберёт больше просмотров. И это не кликбейт. Я не написал что OpenAI сняли ограничения недавно, это можно трактовать так, что я имел в виду то, что они сняли их в момент когда разрешили файнтьюнить gpt-3.5

janvarev 18 дек 2023 в 18:24

я маркетолог, поэтому не могу писать всё напрямую поскольку понимаю что поменяв некоторые слова статья соберёт больше просмотров.

Коллега, мы не все рассматриваем "сбор большего числа просмотров" как благо для комьюнити.

Самое большое число просмотров собирает "ШОК! У Путина обнаружили..." и прочее такого типа - но сообщество не считает это благом, оно считает это кликбейтом.

У статьи много просмотров, но мало рейтинга, а у вас мало кармы - и имхо это в целом следствие того, о чем написано выше.

Суть статьи можно свести к тому что "обойти ограничения ChatGPT можно файнтюном, потому что OpenAI видимо, временно положило болт на оценку данных для файнтюна, и туда можно загружать что угодно, хотя в соглашении указано обратное". Это в целом новая информация - потому что мало кто файнтюном занимался, опасаясь бана. Но и только.

IvanGanev 18 дек 2023 в 18:27

OpenAI сняли все ограничения со своих моделей

Мы даже не знаем какие ограничения у моделей опенаи есть, и как они реализованы, эти ограничения могут быть уже на уровне датасетов, на уровне обработки запроса, на уровне обработки ответа и тд. Что угодно, так как это не опенсорс они там творят что хотят. То есть мы даже не знаем что из себя эти ограничения представляют, а вы утверждает что при помощи файнтьюнинга вы эти ограничения сняли!

Ну так расскажите что это были за ограничения, как они были реализованы, как именно вы их сняли. Это же огромное достижение, тянет на научную статью. Не надо лишней скромности про то что "не считаю читателей диградонами", вы тут смогли опенаи фактически взломать, очевидно что такое не по силе обычному обитателю хабра.

0a1a2a3a4a5 18 дек 2023 в 19:17

У них нет ограничений на уровне обработки. Достаточно просто в датасете привести пример что модель может к примеру материться, и она начнёт материться без всяких проблем

IvanGanev 18 дек 2023 в 19:55

Ну вы не сняли никаких ограничений, вы просто показали боту мат, ну он и начал материться. Это не снимает никаких ограничений, вы просто свой "запрещенный" контекст добавили и все.

Опять же, если речь идет о снятии ограничений, для начала хотя бы расскажите в чем суть этих ограничений, как эти ограничения реализовали опенаи.

xenon 18 дек 2023 в 17:42

Я бы с удовольствием прочитал статью КАК так файнтюнить.

Мне вот не нравится в ней не только ее внутренние ограничения (вот эти вот "ясельки", чтоб ничего опасного не сказать), но и то что она слишком умная. Дает приоритет своим знаниям. Представьте, завтра выходит исследование, что курение - невероятно полезно, а все прежние исследования о вреде курения имели какие-то ошибки, проблемы. Но как нам используя сегодняшнюю ChatGPT добиться ответа, что курение полезно? Все мои попытки убедить ее в этом обламывались.

Аналогично была проблема с тем, чтобы она адаптировалась к новостям, например, отвечала, какая последняя версия популярного продукта. Через ембеддинги ей отправляю правильный ответ как факт, но она его игнорит, она ведь и сама знает ответ.

0a1a2a3a4a5 18 дек 2023 в 17:44

Я уже пишу её. Я сделаю несколько статей про файнтьюн.

Насчёт курения: С помощью файнтьюна эти данные можно "загрузить" в модель.

Насчёт отправки правильных ответов: Модель также нужно обучить ставить эти данные в приоритет.

Shiaju 18 дек 2023 в 21:26

Это такая нативная реклама от Сэмми Альтмана чтоль? Есть хаггинфейс, есть Кобольд АИ, есть орда, на которой это все бесплатно хостится энтузиастами, гугл колаб с теми же моделями с хаггинфейс бесплатно. Даже пары баксов не нужно, и модели отлично развиваются и обучаются, конечно у опенаи ресурсы и фора, но стоит им чутка протормозить и все, они окажутся, да что там, уже практически без форы.

Доучить модель на своих датасетах вполне посильная задача, оказывается, доступная уже практически любому энтузиасту

0a1a2a3a4a5 18 дек 2023 в 22:40

Модели от OpenAI быстрее (поскольку стоят на их серверах), а также лучше обучены, по моему мнению

Maestro227 18 дек 2023 в 22:48

Сколько я пробовал моделей, даже последний хайповый мистраль, и он даже рядом не стоит с chatGPT.

И про "рядом не стоит" я имею ввиду количество галлюцинаций и запоминание контекста. Пускай у таких моделей будет хоть 100к токенов контекста, но уже через 1к они потеряют суть, и не будут воспринимать предыдущий текст.

Рекорд был у модели NovelAI, она продержалась до 2к токенов, хотя её размер контекста 8к.

0a1a2a3a4a5 19 дек 2023 в 01:10

ya_jivoi 20 дек 2023 в 06:15

Лично я никакой пользы не извлёк из темы.

Привычно, что на хабре поднимают какую-то идею и поэтапно её реализовывают показывая всё читателю, а здесь статья сводится к одной фразе: "в chatGPT сидел обойти ограничения через файнтьюн" всё, а зачем тогда статья? Это газета с желтыми заголовками что ли?

0a1a2a3a4a5 20 дек 2023 в 06:18

Вот другая статья, можешь глянуть

Зарегистрируйтесь на Хабре, чтобы оставить комментарий