All streams
Search
Write a publication
Pull to refresh
12
0
Андрей Панферов @black_samorez

ML инженер

Send message

Gradient scaling торчевый частично решает эту проблему. Он, в том числе, отслеживает NaNы в градиентах и дропает батч, если они есть

1.0 этот 100%. Только что создал новый чат, добавил бота, и он работает из коробки

Спасибо. Не знал, что можно это по умолчанию выставить, а не руками в каждой группе права давать

Я чистил по регуляркам >>******, но они как-то просочились. А про релевантность - сильно зависит от promt - текста, приписываемого ко входу. Я опытным путем нашел, что приписывая ", а? " в конце текста можно сильно поднять релевантность. Как-нибудь другие prompt'ы попробую - может еще чего найду.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity