@AuthorsFplus25 фев в 14:00

Ускорители для ЦОД: китайские и российские решения в погоне за NVIDIA

Простой

15 мин

2.9K

Блог компании Fplus TechИскусственный интеллектВидеокартыПроизводство и разработка электроники * IT-инфраструктура *

Обзор

Комментарии 11

@slonoten 25 фев в 14:09

Как-то странно рассказывать о GPU не указывая объём памяти и поддерживаемые фреймворки для обучения и инференса моделей

@AuthorsFplus 26 фев в 09:41

Основная цель статьи — познакомить с самим фактом появления этих видеокарт и их возможными перспективами. Мы тоже заинтересованы в подробных характеристиках, но, к сожалению, далеко не каждый производитель готов раскрыть информацию о точном объёме памяти и поддержке фреймворков в своих продуктах, которые еще даже не вышли в открытый доступ. Как только появятся новые данные, мы обязательно их добавим.

@MikhailShpak 27 фев в 16:09

а тут у коллег - есть кейс, что статья становится слишком большой если описывать все.
и обычно часть вопросов - выносится в серию статей или постов.

Но тут очень хочу и прорекламирую - коллег из МФТИ, Альманах №9 - по железу просто прекрасен.
Там еще не рассматривался Biren/MTT и свежие nVidia/AMD, но основные фреймворки и железо были освещены на достойном уровне - https://aireport.ru/

Будем надеяться, что продолжат радовать фундаментальным подходом.

@vezdexod 25 фев в 16:09

А как сейчас обстоят дела с обучением transformers моделей на GPU от AMD? Есть ли такой опыт? Есть ли смысл брать AMD для обучения?

@Sergey-Fox 25 фев в 21:46

Если стек основан на PyTorch, Hugging Face и LLM, AMD пока ещё не лучший выбор. Но если AMD продолжит развивать ROCm, то через пару лет ситуация может измениться.

Как итог: если нужен стабильный стек — лучше брать NVIDIA; если бюджет ограничен, но хочется попробовать — можно взять AMD (особенно MI200/300); если нужен инференс, а не обучение — AMD тоже может быть хорошим вариантом.

@vezdexod 1 мар в 02:43

Спасибо!)

@MikhailShpak 27 фев в 16:01

Все очень динамично развивается в мире ml/dl.
С точки зрения сквозной архитектуры - очень интересно посмотреть на UEC - https://ultraethernet.org/blog/
Под лидерством AMD формируется консорциум для занятия поля тренинга моделей.

Однако, более интересная статистика, что современные суперкомпьютеры - как направление MPP, так и Cluster уже строятся на AMD/Epyc/RoCE - https://top500.org/lists/top500/2024/11/ - надо скачать XLS и пройтись по полям таблицы

То есть самые интересные кейсы откатают на лоялах в лице - проектов
Explorer-WUS3
Goethe-NHR
Nscale Svartisen
IronMan

Повторюсь, в общем - будем посмотреть, но все развивается слишком быстро, что сложно уследить за процессом.

PS Также был кейс, что Open AI - помимо nVidia будет применять свежие Instinct. но пока бумаги/отчета в открытом доступе еще не видел.

@vezdexod 1 мар в 02:43

Спасибо!)

@nikolz 25 фев в 16:29

Для работы непосредственно с ИИ мы представили высокопроизводительный сервер «Спутник ИИ», в котором используются видеокарты зарубежных производителей.

Главный исполнительный директор компании Fplus Михаил Волков

https://www.cnews.ru/articles/2024-12-24_mihail_volkovfplus_it-proizvoditeli?erid=2W5zFHM2YdN&ysclid=m7kp9f8d3m812366339

@AuthorsFplus 21 мар в 09:18

Добрый день! Благодарим за Ваш комментарий. К сожалению, мы не можем рассказывать всю информацию, поэтому на момент декабря 2024 Михаил не озвучивал, что в Спутнике могут использоваться видеокарты российских вендоров и восточных.

@MikhailShpak 21 мар в 15:59

Тут есть уже и больше новостей...

Ждем согласования к выпуску, но все занимает время.

От дизайна и реестра до реляций в открытом инфо поле.

Времена такие

Зарегистрируйтесь на Хабре, чтобы оставить комментарий