Comments 15
Я хотел бы добавить, что для личного использования графические процессоры AMD также являются хорошим выбором.
Если вы про Instinct 325, то да) А так соотношение производительности, потребления, объема памяти и цены - не лучший выбор (я про 7900xtx другие вообще бессмысленно рассматривать, ну еще 7900xt если с хорошей скидкой покупать)
Надо просто упомянуть, что большинство llm фреймворков ориентированы на cuda, а использование RocM может привести к необоснованным танцам с бубном.
Для локального запуска на ноутбуке - беспорно, можно и на AMD GPU и на хороших процессорах запускать. Часто в организациях для ML\DS выдают для целей разработки высокопроизводительные ноутбуки для локальных тестов моделей
Классная статья, развеяли многие ожидания))). Но из последних новостей, берем покупаем Mac Studio M3 Ultra за 10К$ и запускаем Deepseak на все ~600млрд параметров локально с 4 битной квантизацией. Ну или модель поменьше без квантизации. Но это далеко не 150К$ для корпоративного решения. Я в шоке. В видео блогер показал, довольно шустро работает.
Подскажите пожалуйста, что лучше из CPU: i7 верхнего уровня или начального уровня i9?
На CPU все LLM работают отвратительно. Нужна видеокарта все-таки (RTX 3090 хотя бы)
Конечно, только при наличии граф карты, какой процессор CPU наиболее оптимален?
Для профессиональных задач (обучение, RAG) выбирайте начальный i9. Для экспериментов или тестирования — верхний i7. Если бюджет критичен, но нужна параллелизация, рассмотрите AMD Ryzen 9 (например, Ryzen 9 7950X с 16 ядрами) — он часто дешевле i9 при схожей производительности.
Ну и общие критерии выбора:
1. Чем больше ядер, тем быстрее обработка параллельных задач.
2. Высокая частота ускоряет обработку токенов
3. Больший кэш и быстрая память снижают задержки при доступе к данным
при сравнении верхний i7 vs начальный i9 будет разница ~20-30% в вычислениях. Зависит от бюджета. Обратите внимание на связку CPU-RAM что бы была высокая скорость передачи данных по шине
Очень неожиданно для меня, что для RAG более эффективен i9. Поясните пожалуйста, вроде в RAG в основном работают llm и для них главнее GPU, чем CPU
LLM может запускаться как на ресурсах GPU так и на CPU. Из вашего вопроса выше я понял что хотели запускать только на CPU, поэтому такой и ответ :)
Если планируете на десктопе GPU+CPU, из бюджетных вариантов для инференса:
CPU: i7-14xxxx , Ryzen 7 78xxxx
GPU: RTX 4070 Ti
должно хватить для моделей до 13B
Обращайте внимание на объем, битность, тип, частоту VRAM и частоту GPU.
Какие характеристики на что влияют -есть в статье
Самое понятное объяснение. Автору огромный респект. Так понятно и просто первый раз прочитал, остальные статьи, которые мне попадались: либо никакой конкретики по железу, либо для инопланетян написано, но конкретики снова нет. Спасибо!
Комплексное руководство по конфигурации сервера для LLM