Comments 5
Интересно, можно ли эти модели обрезать до работы только с несколькими языками программирования и английский-русский-китайский, удалить то что не относится к программированию? Чтобы снизить требования по памяти.
Свой суперкомпьютер и обучай на ограниченном объёме текстов. Обученную модель как ты обрежешь, она же голографическая.
Врядли получится, обученность "размазана" по всем весам сети
Sign up to leave a comment.
Новый релиз DeepSeek V3.2-Exp — ускорение и снижение цен на API