Habr
All streams
Search
Edit
Settings
Login
Pull to refresh
0
@dE1l
User
Follow
Send message
Profile
Articles
Posts
News
Comments
1
More
Dropdown
Bookmarks
3
Followers
Following
Copy RSS link
Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают
dE1l
Jun 2 at 19:54
Посмотри в сторону oMLX. Обработка кэша - очень долгая операция. И тут её оптимизировали.
Information
Rating
Does not participate
Registered
November 8 2017
Activity
today at 06:38
Посмотри в сторону oMLX. Обработка кэша - очень долгая операция. И тут её оптимизировали.