Обновить
1

Пользователь

Отправить сообщение

В ту же калитку:

мы продемонстрировали суверенное программно-аппаратное решение, основанное на суверенной аппаратной платформе, построенной на отечественных процессорах, что гарантирует отсутствие закладок

Подскажите каким определением "суверенности" вы пользовались, когда называли Nvidia A100 и llama.cpp "суверенными"

NVIDIA Tesla A100 - золотой стандарт для LLM

Золотой стандарт дай бог 2023 года. Вы попробуйте на ней запустить действительно современные модели: GLM-5.2, Kimi-K2.6 или Deepseek-V4. Либо хотя бы Deepseek-R1, но не дистированную версию :)

В любом случае эта модель устаревшая и смысл данного финта непонятен.

Ещё подскажите пожалуйста, как вы считали 100% отечественности сервера. Давно ли в России начали производить серверные центральные и графические процессоры подобного класса?

Gigachat — открытая модель. Вы бы хоть погугли, прежде чем писать такое :)

Яндекс красный вообще-то)

Так зачем она нужна тогда, если она с другой стороны комнаты не слышит человека?) Яндекс Станции почему-то могут из другой комнаты услышать)

В прошлой статье описывался процесс создания софта под кольцо. Или там тоже обман? Доказательства есть или только балаболить умеете?

Mi Band очень плохой по точности, часы от Хуавея и Apple намного лучше, близко к идеалу.

У Самсунга, например, точность измерений ужасная, судя по тестам The Quantified Scientist.

Данные чипы используются Google для обучения и инференса нейросетей. Также они доступны в Google Cloud для аренды.

В статье описывается TPU v4i, предназначенная только для инференса. На данный момент уже есть TPU v5p для обучения, у которой 95 Гб HBM. И уже на подходе v6 поколение, но пока анонсирован чип только для инференса. К тому же, современные системы обучения или инференса нейросетей не поставляются с одной картой, а серверами или наборами серверов по несколько карт. И отличительной особенностью TPU от Google является interchip interconnect (ICI), который значительно быстрее, чем data center network (DCN), которыми соединены ноды с Nvidia серверы: 9e10 байт/с у ICI против 2.5е10 байт/с у DCN. При этом, ICI соединяет чипы, а DCN — хосты, так что не стоит забывать про pcie bandwidth, который 1.5е10 байт/с на один чип.

Ну и помимо всего прочего, решение Google делать свои ускорители позволяет им иметь меньшую зависимость на одного поставщика конкурентных ускорителей ИИ. Насколько я понимаю, Google является чуть ли не единственной крупной компанией, у которой "ИИ-прод" работает не только преимущественно на решениях Nvidia.

Вы приобрели его? Интересно, как у него с софтом вообще дела обстоят. Для более бесшовной миграции на RISC-V было бы круто иметь аналог Rosetta, какой-нибудь бинарный транслятор, но не уверен, что такое существует в опенсорсе..

Информация

В рейтинге
5 257-й
Зарегистрирован
Активность