Пользователь
Это одинаковые модели, а 8192 = это размер контексного окна модели
Держу в курсе имеется такой проект, там автор даже решил проблему с перебиванием диалога, посмотреть можно тут https://github.com/Mozer/talk-llama-fast
Это одинаковые модели, а 8192 = это размер контексного окна модели
Держу в курсе имеется такой проект, там автор даже решил проблему с перебиванием диалога, посмотреть можно тут https://github.com/Mozer/talk-llama-fast