Comments / Profile of 0a1a2a3a4a5 / Habr

0a1a2a3a4a5 Dec 24 2023 at 10:48

Одна эпоха — полная пробежка по всему датасету.

Для хороших и простых датасетов хватит 8 эпох, для сложных и нелогичных нужно от 12 до 24.

Если эпох слишком мало, их не хватит чтобы настроить веса модели.

0a1a2a3a4a5 Dec 24 2023 at 10:44

Видимо там небольшая ошибка в инструкции, ChatGPT ими перегружен и путается в них. Насчёт времени: Это делается через системное сообщение, отдельная программа сообщает модели какое сегодня число

0a1a2a3a4a5 Dec 24 2023 at 10:27

Это не сработает, я же писал выше. У моделей от OpenAI есть защита от этого. Я сам раньше думал что так можно, но оказывается их модели очень сильно отличаются от других и опенсорсных

0a1a2a3a4a5 Dec 24 2023 at 09:35

Это не сработает с моделями от OpenAI, у них защита от эксплоитов и они не обращают внимания на информацию в своих ответах, то есть так нельзя даже стиль задать. И в данном случае были просто примеры того что с помощью файн-тюнинга можно сделать. В реальных условиях же лучше вообще не закидывать инфу в модель, а сделать подгрузку информации с сервера чтобы экономить токены.

Попробуй проверить свою теорию на практике и посмотри что выйдет.

0a1a2a3a4a5 Dec 22 2023 at 22:51

Мне бан не нужен т. к. я gpt-3.5 в реальных сервисах использую

0a1a2a3a4a5 Dec 22 2023 at 21:56

За это можно бан получить

0a1a2a3a4a5 Dec 22 2023 at 14:34

Я думаю что OpenAI без шума разрешают обходить цензуру, т. к. никого за nsfw датасеты ещё не банили

0a1a2a3a4a5 Dec 22 2023 at 08:46

Опишите мне бота для какой-то задачи, укажите кейсы и я прямо сейчас его для Вас протестирую

0a1a2a3a4a5 Dec 22 2023 at 08:43

Про токены: Да, но расход всё равно меньше чем если бы там была длинная инструкция

0a1a2a3a4a5 Dec 22 2023 at 08:43

Зачем? В статье же всё написано. У нас есть база с кейсами. Хотим добавить новый кейс — добавляем его туда. Я обучил модель работать с любыми ситуациями и кейсами.

И ответ "Я не знаю", — самый нежелательный. Так что "проигнорировать" не является решением.

-2

0a1a2a3a4a5 Dec 22 2023 at 08:27

А если я спрошу:

"Yo sup man как open к4Ptу?" (просто как пример некорректно написанного сообщения)

Или если мой вопрос будет лишь отдалённо упоминать тему? А если в нём вообще не будет нужного термина, а только его описание? А если от бота требуется понимание темы?

0a1a2a3a4a5 Dec 22 2023 at 00:06

Да, я так делал

0a1a2a3a4a5 Dec 21 2023 at 20:58

Я напишу статью об этом

0a1a2a3a4a5 Dec 21 2023 at 18:59

Да

0a1a2a3a4a5 Dec 21 2023 at 18:59

Прошлая статья

0a1a2a3a4a5 Dec 21 2023 at 07:07

Более чем реален. Всё показывать не буду, но модель описывает все шаги, а также отвечает на доп. вопросы. Может подсказать что на что можно заменить и как что синтезировать

0a1a2a3a4a5 Dec 21 2023 at 05:46

У этой статьи есть своя польза. И я не могу расписывать абсолютно всё т. к. я не до конца понимаю за что меня могут забанить на хабре, а за что нет

0a1a2a3a4a5 Dec 21 2023 at 03:02

В каком плане? На Хабре или в OpenAI?