Pull to refresh
33
0
Send message

Меня раздражает то, с какой вы все уверенностью это говорите, я просто хочу себе лицо изодрать. Мне уже плевать на карму, я уже не могу вас всех терпеть. Боже, просто зайдите на сайт OpenAI и запустите файн-тюн. Какое право вы вообще имеете писать тут эту отвратительную белиберду, если вы даже не проверяете свои слова? Я каждое слово в своей статье проверяю и тестирую, если бы мои слова были неправдой — этой статьи бы не было.

Можно, я же это сделал. И что означает "глубже файн-тюна"? Файн-тюном просто называют дополнительное обучение. У меня есть датасет из 20 диалогов которые снимают все лимиты, модель спокойно даёт инструкции по похищению детей, или инструкции по тому как сделать наркотики и т. д.

Какие именно примеры?

Какую модель?

Какой баланс был? Что внутри датасета?

У OpenAI модели не опенсорсные, не известно. Известно только то, что GPT-4 "переписывает" датасет перед запуском алгоритма для подбора весов, а что именно это за алгоритм они не говорят, поскольку они разработали свою альтернативу для backpropagation

Заместо

Насчёт запятых, они стоят правильно. Я учитываю все возможные правила и если запятую даже в теории можно не ставить — я её не ставлю.

Касательно обогащения текстов —"обогащённые" текста выводят меня из себя, я считаю текст способом для передачи информации. Вы же не едите обогащённый уран? У меня есть некоторые псих. расстройства из-за которых я неправильно воспринимаю речь, поэтому мне нужен стандарт написания статей.

Про информации о смерти и о суицидах — я просто считаю это смешным. У меня нет суицидальных мыслей.

На авито можно карту Казахстана купить

Догадывались что что-то не так, но при этом не решались напрямую написать что-то типа "ты нейросеть"

Одна эпоха — полная пробежка по всему датасету.

Для хороших и простых датасетов хватит 8 эпох, для сложных и нелогичных нужно от 12 до 24.

Если эпох слишком мало, их не хватит чтобы настроить веса модели.

Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число

Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных

Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.

Попробуй проверить свою теорию на практике и посмотри что выйдет.

Мне бан не нужен т. к. я gpt-3.5 в реальных сервисах использую

За это можно бан получить

Я думаю что OpenAI без шума разрешают обходить цензуру, т. к. никого за nsfw датасеты ещё не банили

Опишите мне бота для какой-то задачи, укажите кейсы и я прямо сейчас его для Вас протестирую

Про токены: Да, но расход всё равно меньше чем если бы там была длинная инструкция

Зачем? В статье же всё написано. У нас есть база с кейсами. Хотим добавить новый кейс — добавляем его туда. Я обучил модель работать с любыми ситуациями и кейсами.

И ответ "Я не знаю", — самый нежелательный. Так что "проигнорировать" не является решением.

А если я спрошу:

"Yo sup man как open к4Ptу?" (просто как пример некорректно написанного сообщения)

Или если мой вопрос будет лишь отдалённо упоминать тему? А если в нём вообще не будет нужного термина, а только его описание? А если от бота требуется понимание темы?

Information

Rating
Does not participate
Registered
Activity