Я чистил по регуляркам >>******, но они как-то просочились. А про релевантность - сильно зависит от promt - текста, приписываемого ко входу. Я опытным путем нашел, что приписывая ", а? " в конце текста можно сильно поднять релевантность. Как-нибудь другие prompt'ы попробую - может еще чего найду.
Gradient scaling торчевый частично решает эту проблему. Он, в том числе, отслеживает NaNы в градиентах и дропает батч, если они есть
1.0 этот 100%. Только что создал новый чат, добавил бота, и он работает из коробки
Спасибо. Не знал, что можно это по умолчанию выставить, а не руками в каждой группе права давать
Я чистил по регуляркам >>******, но они как-то просочились. А про релевантность - сильно зависит от promt - текста, приписываемого ко входу. Я опытным путем нашел, что приписывая ", а? " в конце текста можно сильно поднять релевантность. Как-нибудь другие prompt'ы попробую - может еще чего найду.