Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число
Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных
Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.
Попробуй проверить свою теорию на практике и посмотри что выйдет.
Зачем? В статье же всё написано. У нас есть база с кейсами. Хотим добавить новый кейс — добавляем его туда. Я обучил модель работать с любыми ситуациями и кейсами.
И ответ "Я не знаю", — самый нежелательный. Так что "проигнорировать" не является решением.
"Yo sup man как open к4Ptу?" (просто как пример некорректно написанного сообщения)
Или если мой вопрос будет лишь отдалённо упоминать тему? А если в нём вообще не будет нужного термина, а только его описание? А если от бота требуется понимание темы?
Более чем реален. Всё показывать не буду, но модель описывает все шаги, а также отвечает на доп. вопросы. Может подсказать что на что можно заменить и как что синтезировать
Одна эпоха — полная пробежка по всему датасету.
Для хороших и простых датасетов хватит 8 эпох, для сложных и нелогичных нужно от 12 до 24.
Если эпох слишком мало, их не хватит чтобы настроить веса модели.
Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число
Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных
Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.
Попробуй проверить свою теорию на практике и посмотри что выйдет.
Мне бан не нужен т. к. я gpt-3.5 в реальных сервисах использую
За это можно бан получить
Я думаю что OpenAI без шума разрешают обходить цензуру, т. к. никого за nsfw датасеты ещё не банили
Опишите мне бота для какой-то задачи, укажите кейсы и я прямо сейчас его для Вас протестирую
Про токены: Да, но расход всё равно меньше чем если бы там была длинная инструкция
Зачем? В статье же всё написано. У нас есть база с кейсами. Хотим добавить новый кейс — добавляем его туда. Я обучил модель работать с любыми ситуациями и кейсами.
И ответ "Я не знаю", — самый нежелательный. Так что "проигнорировать" не является решением.
А если я спрошу:
"Yo sup man как open к4Ptу?" (просто как пример некорректно написанного сообщения)
Или если мой вопрос будет лишь отдалённо упоминать тему? А если в нём вообще не будет нужного термина, а только его описание? А если от бота требуется понимание темы?
Да, я так делал
Я напишу статью об этом
Да
Прошлая статья
Более чем реален. Всё показывать не буду, но модель описывает все шаги, а также отвечает на доп. вопросы. Может подсказать что на что можно заменить и как что синтезировать
У этой статьи есть своя польза. И я не могу расписывать абсолютно всё т. к. я не до конца понимаю за что меня могут забанить на хабре, а за что нет
В каком плане? На Хабре или в OpenAI?
Если что, я не поддерживаю ответы модели в тестах
У OpenAI модели защищены от эксплоитов, так что с ними что-то подобное нельзя сделать