Комментарии / Профиль tensorprogrammer / Хабр

Пользователь

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

В ту же калитку:

мы продемонстрировали суверенное программно-аппаратное решение, основанное на суверенной аппаратной платформе, построенной на отечественных процессорах, что гарантирует отсутствие закладок

Подскажите каким определением "суверенности" вы пользовались, когда называли Nvidia A100 и llama.cpp "суверенными"

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

tensorprogrammer 24 июн в 13:13

NVIDIA Tesla A100 - золотой стандарт для LLM

Золотой стандарт дай бог 2023 года. Вы попробуйте на ней запустить действительно современные модели: GLM-5.2, Kimi-K2.6 или Deepseek-V4. Либо хотя бы Deepseek-R1, но не дистированную версию :)

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

tensorprogrammer 24 июн в 13:10

В любом случае эта модель устаревшая и смысл данного финта непонятен.

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

tensorprogrammer 24 июн в 13:07

Ещё подскажите пожалуйста, как вы считали 100% отечественности сервера. Давно ли в России начали производить серверные центральные и графические процессоры подобного класса?

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

tensorprogrammer 24 июн в 12:48

Gigachat — открытая модель. Вы бы хоть погугли, прежде чем писать такое :)

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

tensorprogrammer 6 окт 2025 в 16:21

Яндекс красный вообще-то)

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

tensorprogrammer 6 окт 2025 в 16:20

Так зачем она нужна тогда, если она с другой стороны комнаты не слышит человека?) Яндекс Станции почему-то могут из другой комнаты услышать)

Ювелирная работа, или Как мы разрабатывали Умное кольцо Sber (часть 2)

tensorprogrammer 6 окт 2025 в 16:14

В прошлой статье описывался процесс создания софта под кольцо. Или там тоже обман? Доказательства есть или только балаболить умеете?

Ювелирная работа, или Как мы разрабатывали Умное кольцо Sber (часть 1)

tensorprogrammer 6 окт 2025 в 16:03

Mi Band очень плохой по точности, часы от Хуавея и Apple намного лучше, близко к идеалу.

Ювелирная работа, или Как мы разрабатывали Умное кольцо Sber (часть 1)

tensorprogrammer 6 окт 2025 в 16:01

У Самсунга, например, точность измерений ужасная, судя по тестам The Quantified Scientist.

Десять уроков развития аппаратных ускорителей для ИИ: как эволюция TPU привела к созданию TPUv4i

tensorprogrammer 19 мар 2025 в 08:20

Данные чипы используются Google для обучения и инференса нейросетей. Также они доступны в Google Cloud для аренды.

В статье описывается TPU v4i, предназначенная только для инференса. На данный момент уже есть TPU v5p для обучения, у которой 95 Гб HBM. И уже на подходе v6 поколение, но пока анонсирован чип только для инференса. К тому же, современные системы обучения или инференса нейросетей не поставляются с одной картой, а серверами или наборами серверов по несколько карт. И отличительной особенностью TPU от Google является interchip interconnect (ICI), который значительно быстрее, чем data center network (DCN), которыми соединены ноды с Nvidia серверы: 9e10 байт/с у ICI против 2.5е10 байт/с у DCN. При этом, ICI соединяет чипы, а DCN — хосты, так что не стоит забывать про pcie bandwidth, который 1.5е10 байт/с на один чип.

Ну и помимо всего прочего, решение Google делать свои ускорители позволяет им иметь меньшую зависимость на одного поставщика конкурентных ускорителей ИИ. Насколько я понимаю, Google является чуть ли не единственной крупной компанией, у которой "ИИ-прод" работает не только преимущественно на решениях Nvidia.

Одноплатные компьютеры, которые вывезут почти все: пять новинок последнего времени

tensorprogrammer 16 мар 2025 в 12:31

Вы приобрели его? Интересно, как у него с софтом вообще дела обстоят. Для более бесшовной миграции на RISC-V было бы круто иметь аналог Rosetta, какой-нибудь бинарный транслятор, но не уверен, что такое существует в опенсорсе..