Comments / Profile of savvadesogle / Habr

User

ProfileArticlesPostsNewsComments35

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

savvadesogle Jun 30 at 06:05

А вы не знаете, ik_llama.cpp так же поддерживает xpu (intel), как и llama.cpp? При загрузке слоев вы указываете CUDA0, CUDA1, а для XPU тоже есть аналогичный выбор устройства в ik_llama.cpp?

0

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

savvadesogle Jun 29 at 20:00

Да вот как раз, чтобы скорость не падала и поднимают несколько экземпляров.
Две модели и каждой выделить узел Numa + свою GPU норм, если достаточно RAM..

А насколько GPU Загружена была при 4х параллельных запросах?

0

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

savvadesogle Jun 29 at 18:17

Добрый день

Подскажите, а вы не встречали, можно ли с MoE моделькой провернуть следующее:
Есть RAM для одного экземпляра модели, 2x GPU (с объемом VRAM одного GPU достаточном для загрузки слоёв активного эксперта).
В RAM загрузить один экземпляр модели, а в VRAM одного GPU загрузить слои активного эксперта, а в VRAM второй GPU - ещё один экземпляр эксперта активного эксперта.. И отдельными процессами запускать инференс, параллельно через роутинг.

В плане, я видел как в RAM 2х экземпляра грузят модели, и двумя процессами отдельно инференсят используя роутинг. Например, есть 1024 GB RAM и 2 GPU, и параллельно запускают два отдельных Qwen3-235B-A22B + Qwen3-235B-A22B.
Но, если RAM мало, то может есть хаки с тем, чтобы оставить один экзепляр всей модели в RAM.
На ум приходит аналогия с совместным использованием библиотек процессами (одна либа в памяти, и разные процессы ее юзают).

0

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

savvadesogle Jul 20 2023 at 09:10

Подскажите, пожалуйста, а какие " юридические документы" участвовали в дообучении?

+1

Если вы в Казани или Новосибирске и хотите проектировать микросхемы, как в Купертино

savvadesogle Sep 20 2018 at 19:25

Сделано) спасибо за наводку!

+2

Если вы в Казани или Новосибирске и хотите проектировать микросхемы, как в Купертино

savvadesogle Sep 20 2018 at 19:04

Видео запись будет вестись?

0

Японские феи показывают работу master-slave триггера в новой манге по цифровой электронике

savvadesogle Sep 12 2018 at 06:17

За исправления — спасибо! В некоторых местах из-зи ошибок долгое время не приходило понимание материала. Бывало и так, что прочитав главу или последующую — возвращался и понимал где находится опечатка.

0

Как не стать Python-разработчиком

savvadesogle Mar 12 2018 at 08:57

А что такое «горилла»?

-1

Книга «Linux API. Исчерпывающее руководство»

savvadesogle Feb 14 2018 at 06:51

У Лафоре я ~300 страниц изучал 1.5 месяца. И то потому, что там была вводная часть)
А после появилась трудность с выделением времени и места для погружения и процесс замедлился.

0

Книга «Linux API. Исчерпывающее руководство»

savvadesogle Feb 13 2018 at 12:12

1241 страницы… Как же хочется научиться читать такие книги так же быстро как обычные…
А так… это на пол года, ну плюс/минус месяц)

0

Linux-2018: самые перспективные дистрибутивы

savvadesogle Jan 25 2018 at 10:17

❥Китайский Deepin, китайский сяоми эйр и набор плюшек из коробки в виде авто дня/ночи, масштабирования, интуитивных жестов, и многих других важных мелочей, делают жизнь приятней)

На большом (17") ноутбуке стоит ubuntu — небо и земля. Deepin замечательный дистрибутив. Рад что в декабре случайно напоролся на него.

Потрясающий интерфейс, отсутствие «отдельных» настроек. Предустановленный, входящий в дистрибутив софт — самое то для начала.
И, действительно, как подметили ранее — отсутствие ошибок и падений. То, что очень раздражает в ubuntu из коробки.

Вся эта простота сперва кажется непривычной, но за пару часов входишь во вкус и понимаешь, что именно так и выглядит «удобно».

Тот самый случай «заводского» Китая, спасибо людям, которые приняли участие в работе над Deepin.

Почему-то ни в Mac OS, ни в Windows не сумели объединить все эти удобства в один интерфейс.
Сказать, что все это позаимствовано у других? Да, так и есть. Так и должны были крупные производители софта поступить уже давно, но ведь не сделали удобно.

ps. в Mac Os не был с 2015го, поэтому могу заблуждаться.

0

Нигерийские истории российского разработчика

savvadesogle Jan 16 2018 at 10:56

«Главная проблема — необходимость наличия живого сотрудника на том конце» — звучало слегка стремно, после прочитанной истории )

-1

Сказ о тотальном переборе, или Томительное ожидание декрипта

savvadesogle Jan 15 2018 at 12:42

Спасибо!

+1

Hands-On Programming With R — Garrett Grolemund

savvadesogle Jan 15 2018 at 07:59

Спасибо. А как вы используете R?

0

Решение, которое нужно принять, чтобы не жалеть о жизни через 30 лет

savvadesogle Jan 15 2018 at 07:46

Хорошо проведенное время

-1

Hands-On Programming With R — Garrett Grolemund

savvadesogle Jan 15 2018 at 07:35

А как создается связка R и Web?

0

Hands-On Programming With R — Garrett Grolemund

savvadesogle Jan 15 2018 at 07:02

Что лучше использовать для работы с данными: Python или R?
Условие 1: Python хорошо известен
Условия 2: ни R ни Python не известны

Буду благодарен, если еще и объясните почему лучше выбрать R вместо Python.

-1

Сказ о тотальном переборе, или Томительное ожидание декрипта

savvadesogle Jan 15 2018 at 06:55

Будьте добры, перепишите код на Python c использованием itertools (https://docs.python.org/2/library/itertools.html).

Взамен смогу предоставить 2683v4x2 + 6380x2 для тестов (32 Gb RAM DDR3 и DDR4, OS увы Windows)

Буду Вам признателен.

0

Git: советы новичкам – часть 1

savvadesogle Dec 27 2017 at 15:18

Как ведёт себя гит с бинарными файлами? .pad, .jpg, .Avi и так далее? Есть ли специализированные системы контроля версий для не текстовых файлов?

0

Введение бесплатного размещения заказов и расширенная подписка для фрилансеров

savvadesogle Nov 2 2017 at 10:04

Вчера с утра был размещен заказ и в 12 часов дня (по Москве) был отправлен в архив, не мной!

Написал об этом тех поддержке. Потом увидел о вашем обновлении, подумал с этим связанно.

Вернул активность заказу, вытащив из архива. Так потом опять в 16:00 отправили в архив!
Почему?

Процитирую FyvaOldj:

А оно вообще работает? Мертворожденный проект

И вправду, а сервис то работает? На кой фрилансерам этот сервис, если работодатель не может разместить заказы? За что, собственно, подписки вы продаете исполнителям?

Я не могу разместить задачу, она все время уходит в архив и об этом я узнаю только благодаря письму, а сколько оно там уже в архиве — не известно (да и пока письмо прочту).

Естественно, пойду теперь на другие биржи.

0

1