Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Интересно, можно ли эти модели обрезать до работы только с несколькими языками программирования и английский-русский-китайский, удалить то что не относится к программированию? Чтобы снизить требования по памяти.
Свой суперкомпьютер и обучай на ограниченном объёме текстов. Обученную модель как ты обрежешь, она же голографическая.
Врядли получится, обученность "размазана" по всем весам сети
Новый релиз DeepSeek V3.2-Exp — ускорение и снижение цен на API