All streams
Search
Write a publication
Pull to refresh
17
0
Send message

Одна эпоха — полная пробежка по всему датасету.

Для хороших и простых датасетов хватит 8 эпох, для сложных и нелогичных нужно от 12 до 24.

Если эпох слишком мало, их не хватит чтобы настроить веса модели.

Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число

Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных

Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.

Попробуй проверить свою теорию на практике и посмотри что выйдет.

Мне бан не нужен т. к. я gpt-3.5 в реальных сервисах использую

За это можно бан получить

Я думаю что OpenAI без шума разрешают обходить цензуру, т. к. никого за nsfw датасеты ещё не банили

Опишите мне бота для какой-то задачи, укажите кейсы и я прямо сейчас его для Вас протестирую

Про токены: Да, но расход всё равно меньше чем если бы там была длинная инструкция

Зачем? В статье же всё написано. У нас есть база с кейсами. Хотим добавить новый кейс — добавляем его туда. Я обучил модель работать с любыми ситуациями и кейсами.

И ответ "Я не знаю", — самый нежелательный. Так что "проигнорировать" не является решением.

А если я спрошу:

"Yo sup man как open к4Ptу?" (просто как пример некорректно написанного сообщения)

Или если мой вопрос будет лишь отдалённо упоминать тему? А если в нём вообще не будет нужного термина, а только его описание? А если от бота требуется понимание темы?

Да, я так делал

Я напишу статью об этом

Прошлая статья

Более чем реален. Всё показывать не буду, но модель описывает все шаги, а также отвечает на доп. вопросы. Может подсказать что на что можно заменить и как что синтезировать

У этой статьи есть своя польза. И я не могу расписывать абсолютно всё т. к. я не до конца понимаю за что меня могут забанить на хабре, а за что нет

В каком плане? На Хабре или в OpenAI?

Если что, я не поддерживаю ответы модели в тестах

У OpenAI модели защищены от эксплоитов, так что с ними что-то подобное нельзя сделать

Information

Rating
Does not participate
Registered
Activity