Comments / Profile of uzd / Habr

How to become an author

Андрей Шараев @uzd

User

ProfileArticlesPostsNewsComments42

Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти

uzd Feb 7 at 09:23

Для модели calme-3.2-instruct-78b-Q4_K_M на простых промптах я получил примерно такие цифры производительности через llama.cpp:
prompt eval time = 7981.25 ms / 98 tokens ( 81.44 ms per token, 12.28 tokens per second) eval time = 148880.31 ms / 372 tokens ( 400.22 ms per token, 2.50 tokens per second) total time = 156861.56 ms / 470 tokens
P.S. А в DeepSeek-R1 для обработки запроса активируются только 37B из 671B параметров - это особенность моделей MoE.

0

Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти

uzd Feb 6 at 20:23

Я у себя запустил deepseek-r1:671b на базе 1xEPYC 7702.
Конфигурация памяти - 16 x 64GB, работает в 8-канальном режиме на частоте 2933 MT/s.

Моделька работает на скорости 3.5-4.0 t/s, без фризов и без подгрузки данных с диска в RAM, как было описано в статье. Общаться с ней вполне можно, кроме случаев, когда в промпт нужно закинуть большой кусок текста или километрового лог-файла - парсинг такого промпта перед началом рассуждений модели может занять десятки минут.

Для запуска использовал ollama на базе ubuntu server. Модель при первом же запросе сначала полностью загружалась в память, и только потом шла обработка моего промпта.
Теоретически, если запустить модель на более свежем железе (EPYC 9005 в 12-канальном режиме на частоте DDR5-6000), то скорость работы модельки может быть до 3 раз быстрее относительно моего конфига.

P.S. Возможно, что автор столкнулся с описанной проблемой из-за параметра а-ля "use_mmap=1", который вместо загрузки данных модели с диска в RAM просто делает маппинг файла в оперативную память, и дальнейшее обращение к данным в памяти требует чтения с диска.

+12

Перспективы развития центральных процессоров

uzd Feb 27 2011 at 16:50

Спасибо автору за замечательный текст. Прочитал с удовольствием.

+2

IPv4 закончился. Чего будет? IPv6?

uzd Feb 2 2011 at 22:12

В Беларуси года 3 никто из провайдеров рыпаться с переходом на ipv6 походу не будет…

+3

Великий Белорусский файрвол

uzd Jul 10 2010 at 14:42

Мама подключает интернет ребенку для учебы, вполне может написать такое заявление, если будет знать про такую возможность. А тут дело за маркетингом — это можно продавать как услугу за отдельную абон. плату.

+1

Великий Белорусский файрвол

uzd Jul 10 2010 at 14:30

Фильтроваться будет на стороне провайдера, поэтому методы обхода будут зависеть от софта, которым провайдер фильтрует серфинг пользователя. Хорошо, что это все на добровольной основе по письменному заявлению пользователя…

-1

А вы работаете по специальности, полученной в ВУЗе?

uzd Jan 24 2010 at 13:10

Забил на учебу в универе, пошел работать по специальности.
Позже поступил на заочный факультет в другой универ.
Положением доволен, не нужно тратить много времени на неинтересные мне вещи.

0

Поколение геймеров

uzd Jan 17 2010 at 18:01

Живете с тем, кто постоянно играет в MMORPG?
Я про киберспорт вообще-то говорю. А вообще люди разные бывают.
Я лишь выразил свое мнение над таким обобщением, которое написал rewiaca. Обычный стереотип…

+1

Поколение геймеров

uzd Jan 17 2010 at 17:57

из тех, кого знаю лично — нет.

+4

Поколение геймеров

uzd Jan 17 2010 at 15:44

Самое интересное, что из всех известных мне людей (как моих знакомых, так и всяких известных в комьюнити личностей), которые играют ради соревновательного элемента в компьютерные игры — практически все до одного внешне нормально выглядят, учатся в универах, у многих даже девушка есть.
Так что представить ситуацию из Вашего поста мне крайне трудно.

+5

Не совсем обычное VPN соединение обычными средствами

uzd Jan 15 2010 at 18:24

А про l2tp не слова. В нем трафик инкапсулируется в UDP пакеты. Так что проблем с прохождением через интернет у него нет.

+1

Одновременное использование двух провайдеров на маршрутизаторах cisco (продолжение)

uzd Jan 14 2010 at 20:17

bgp maximum-paths — можно указать количество параллельно используемых путей маршрутизации.

0

Одновременное использование двух провайдеров на маршрутизаторах cisco (продолжение)

uzd Jan 14 2010 at 18:40

Не жизнеспособный конфиг.
При маршрутизации от источника производительность никакая.

+2

uzd Nov 21 2009 at 22:49

Конца света не будет. Я гарантирую это.

-7

Хакеры устроили блэкаут в Бразилии

uzd Nov 9 2009 at 05:46

… и разместили бы кнопку «пуск» на главной странице сайта.

0

Инвайты на Google Wave

uzd Nov 7 2009 at 17:06

andr.sharaev@gmail.com

0

Серьезный разговор о VLC

uzd Oct 31 2009 at 17:03

«Привлекая кроссплатформенностью (Linux, Windows,Ubuntu...»
приехали

+14

Подводные камни при использовании кэширования в nginx

uzd Oct 16 2009 at 04:51

отличная статья

0

Несвободные дистрибутивы (мнение GNU)

uzd Oct 13 2009 at 19:09

Дожили, ограничивать понятием «свобода» список доступного некоммерческого ПО в дистрибутиве — это не свобода в моем понимании.

0

Софт для ISP

uzd Sep 12 2009 at 09:04

биллинг — UTM
мониторим через cacti + nagios
сервера под vmware esxi
сетевое оборудование — hp procurve и hp proliant
vpn сервер — cisco

0

1