Habr
All streams
Search
Edit
Settings
Login
Pull to refresh
1
@yusai
User
Follow
Send message
Profile
Articles
Posts
News
Comments
1
More
Dropdown
Bookmarks
Followers
Following
Copy RSS link
Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM
yusai
Nov 2 2025 at 14:51
Можно ли так развернуть 120b на vllm? cpu inference не особо быстрый и не запускается с 120b
Information
Rating
Does not participate
Registered
November 2 2025
Activity
April 8 at 09:25
Можно ли так развернуть 120b на vllm? cpu inference не особо быстрый и не запускается с 120b