Обновить
20.45

Видеокарты

Графические адаптеры

Сначала показывать
Порог рейтинга

Пользователь Reddit под ником Beautiful-Turnip-353 собрал рабочий макет миниатюрной железной дороги на бэкплейте видеокарты, установленной внутри ПК. Энтузиаст использовал один из самых маленьких масштабов поезда (T-gauge, 1:450), где ширина колеи всего 3 мм. Минипоезд приводится в движение платой Arduino, подключённой к USB и подающей 5V PWM-сигнал. Автор планирует реализовать две задумки: подключить поезд к 5V PWM-разъёму для вентилятора на материнской плате, а также сделать так, чтобы скорость поезда будет напрямую зависела от температуры GPU: чем горячее видеокарта, тем быстрее будет ехать поезд.

Теги:
+5
Комментарии2

Основатель Telegram Павел Дуров представил децентрализованную сеть Cocoon (Confidential Compute Open Network), которая будет задействовать искусственный интеллект и блокчейн TON. Проект, запуск которого запланирован на ноябрь 2025 года, предназначен для безопасного и приватного выполнения ИИ-инференса на условиях полной анонимности.

Cocoon представляет собой децентрализованную вычислительную сеть, которая объединяет технологии искусственного интеллекта (ИИ) и блокчейна TON. По словам основателя Telegram, централизованные ИИ-платформы могут собирать и использовать данные пользователей, а Cocoon является альтернативным решением, которое основано на принципах децентрализации и приватности. Владельцы GPU предоставляют создателям ИИ-приложений вычислительные мощности для их работы в обмен на криптовалюту TON, а рядовые пользователи сохранят полную конфиденциальность при работе с ИИ-продуктами. Запуск технологии запланирован на ноябрь 2025 года.

Предполагается, что сеть Cocoon будет работать на основе GPU-майнеров, получающих вознаграждение в Toncoin, а разработчики приложений получат доступ к недорогим ИИ-инструментам. По словам Павла Дурова, Cocoon обеспечит полную приватность и децентрализацию, позволяя интегрировать любые ИИ- агенты, включая DeepSeek и Qwen, без риска утечек.

Примечательно, что на презентации Дуров с иронией добавил, что изначально рассматривал для проекта название Private AI Network, что образует аббревиатуру P.A.I.N. («боль»).

Теги:
0
Комментарии1

Японская компания Nagao Manufacturing вернула в продажу зеркало для видеокарты в системный блок Graphics Board Mirror Display (NB-VGA-MIRROR) стоимостью $21. Этот аксессуар представляет собой магнитную рамку с зеркалом, которая позволяет пользователям видеть свою видеокарту во всей красе. Также подставка с зеркалом оснащена регулируемым механизмом, который позволяет устанавливать угол наклона от 0 до 90 градусов.

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии2

+10% к производительности сервера с конфигурацией AR45-NVMe 

Нужна высокая производительность на одном узле, но серверная платформа не по бюджету и избыточна? AR45-NVMe — готовый сервер с передовым десктопным CPU, локальной сетью и быстрыми NVMe-дисками. Решение спроектировано именно для таких задач. Предложение ограничено, успейте заказать сервер по ссылке —>

Характеристики:

  • CPU: AMD RyzenTM 9 9950X, 16 ядер, до 4.3 ГГц;

  • RAM: 192 ГБ DDR5 (non-ECC);

  • Диск: 2×2000 ГБ SSD NVMe M.2;

  • Сеть и сервис: 1 Гбит/с приватная сеть, безлимитный трафик, SLA 99.8%,защита от DDoS, 24/7 поддержка, 3 часа на замену комплектующих.

Из чего состоит прирост производительности +10%

Высокая частота сокращает задержки в задачах, где важна оперативность: сборки, компиляции, отладки и CI-прогоны реагируют быстрее, потому что ядра решают мелкие задачи быстрее.

Больше RAM значит реже подкачка на диск, меньше простоев из-за swapping и стабильнее in-memory вычисления при аналитике и прототипировании ML.

Низкая задержка и высокая пропускная способность, плюс рост числа операций ввода-вывода в секунду (IOPS). Они ускоряют доступ к временным файлам, БД и scratch-пространству. Которые при хранении в сетевом сторадже тормозят работу.

Теги:
Всего голосов 9: ↑8 и ↓1+13
Комментарии2

GPU H200 в новой конфигурации выделенных серверов уже в Selectel


NVIDIA H200 — одна из самых мощных видеокарт для задач искусственного интеллекта с 141 ГБ памяти. В новой конфигурации — восемь GPU в формате SXM. Карты могут обмениваться данными на скорости до 4,8 Тбайт/сек. Поэтому конфигурация точно подходит для машинного обучения и инференса LLM.

Практическое применение:

  1. Можно загружать большие параметры и контексты без постоянного свопа на диск — 141 ГБ vRAM в каждой карте позволяют работать с моделями и батчами, которые раньше требовали шардинга. 

  2. Высокая пропускная способность памяти (4.8 ТБ/с) ускоряет подачу данных в тензорные ядра для быстрого обучения и инференса больших языковых моделей и повышения скорости обработки токенов.

  3. NVLink и SXM-формат минимизируют накладные расходы на обмен между GPU, что критично для крупных распределенных пайплайнов. 

Selectel уже предлагает конфигурации с современными GPU и серверными платформами и готов собирать выделенные решения под H200-платформы. Берите в аренду 8×H200 в проверенной инфраструктуре вместо покупки и обслуживания собственного кластера.


Закажите конфигурацию с H200 в Selectel по ссылке  

Теги:
Всего голосов 7: ↑7 и ↓0+12
Комментарии1

Вышла обновленная и дополненная версия статьи Темные лошадки ИИ - Инференс LLM на майнинговых видеокартах Nvidia CMP 40HX, CMP 50HX, CMP 90HX

В новой версии добавлены проверенные данные по CMP 40HX, результаты практических тестов и реальное сравнение с RTX 3060

Теги:
Рейтинг0
Комментарии0

Арендуйте RTX A2000 за 1₽ в Selectel

Мы расширили линейку GPU-карт, которые можно арендовать за рубль при создании кастомных конфигураций выделенных серверов. Список видеокарт пополнила NVIDIA RTX А2000.

Низкопрофильный дизайн позволяет установить GPU в самый компактный корпус сервера, а память GDDR6 с коррекцией ошибок — защитить данные и сохранить точность расчетов.

Какие особенности у RTX А2000

  • 6 ГБ высокоскоростной памяти GDDR6 с ECC,

  • 104 тензорных ядра четвертого поколения,

  • 3 328 ядра CUDA третьего поколения.

Карта подходит, например, для сложных ML-задач, видеомонтажа и работы с графикой.

Арендовать А2000 за 1 рубль.

Теги:
Всего голосов 5: ↑5 и ↓0+9
Комментарии0

К Облаку Рег.ру подключили новые GPU NVIDIA A4000

В облачную платформу Рег.ру добавили новые GPU NVIDIA A4000. Теперь можно решить еще больше запросов на выгодных условиях: от 3D-моделирования и работы в CAD-программах до сложных вычислений и обучения ИИ-моделей. Облачные серверы с GPU позволяют быстро получать результат без собственного оборудования и работают по системе Pay-as-you-go.

Также напомним, что в Облаке Рег.ру доступны видеокарты NVIDIA: А5000 24Гб и А100 80Гб. Попробовать новые NVIDIA A4000 можно уже на сайте.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Обучение модели GPT-2: часы вместо недель

Для тестирования GPU-сервера YADRO G4208P G3 в конфигурации с восемью Н100 NVL / RTX 4090 мы выбрали бенчмарк на основе реализации обучения для модели GPT-2 на 1,558 миллиарда параметров из репозитория проекта llm.c Андрея Карпаты. 

Эта модель была представлена OpenAI в блоге Better Language Models and Their Implications в феврале 2019 года. Тогда для ее обучения требовались команда инженеров и десятки топовых V100, а процесс длился неделями.

Сейчас, шесть лет спустя, достаточно одного сервера с восемью картами H100, а обучение занимает 1–1,6 суток. Все это благодаря развитию GPU, современным библиотекам, таким как CUDA и cuDNN, а также открытым датасетам типа FineWeb-Edu. 

Андрей Карпаты показывает, что это возможно даже без фреймворков вроде PyTorch или TensorFlow. Все обучение реализовано примерно в 5 тысячах строк на C и CUDA. 

Мы проверили, как справляются серверы YADRO c обучением GPT-2 на 1,6 миллиарда параметров. Обучение на конфигурации G4208P с восемью H100 NVL заняло 38 часов, или примерно 1.6 суток. На графике ниже показываем соотношение времени исполнения 50 шагов обучения на конфигурации G4208P с RTX 4090 по сравнению с конфигурацией на Н100 NVL: 

Артём Маклаев с командой, которая занимается оценкой производительности серверных платформ для ИИ-задач в YADRO, поделился в статье результатами десятка тестов GPU-сервера с 8x Н100 NVL / RTX 4090: от инференса моделей распознавания речи до обучения LLM.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Первый взгляд на Ryzen "AI" MAX+ 395 ч.1

Привет Хабр, свой первый пост я посчитал полезным сделать так как интерес к локальному инференсу растёт и в оптику искателей железа скорее всего попадал AMD APU Strix Halo - Ryzen AI MAX+ 305 - самый производительный из всего поколения.
Спецификация которого тут https://www.amd.com/en/products/processors/laptop/ryzen/ai-300-series/amd-ryzen-ai-max-plus-395.html

До меня добрался Gmktec Evo X-2 в комплектации с 128 ГБ RAM
https://www.gmktec.com/products/amd-ryzen™-ai-max-395-evo-x2-ai-mini-pc

Сразу оговорюсь, что пока ко мне едет второй диск под отдельную систему, все тесты представленные ниже проведены на поставляемой в комплекте Windows 11 Pro
Сборка 26100.4061
Adrenalin Edition 24.20.64 (Драйверы от AMD)
HIP 6.2.4

Что в коробке с Gmktec Evo X-2
Что в коробке с Gmktec Evo X-2

Processor: AMD RYZEN AI MAX+ 395 @ 3.00GHz (16 Cores / 32 Threads),
Motherboard: GMKtec (1.04 BIOS),
Memory: 8 x 16384MB 8000MHz Micron MT62F4G32D8DV-023 WT,
Disk: 1908GB ADATA LEGEND 900,
Graphics: AMD Radeon 8060S 4GB,
Audio: Senary Audio + AMD Streaming Audio Device + AMD HD Audio Device,
Monitor: LG ULTRAINE,
Network: ASIX AX88179 USB 3.0 Gigabit + Realtek Gaming 2.5GbE + Bluetooth Device (Personal Area )
OS: Microsoft Windows 11 Pro Build 26100, Kernel: 10.0.26100.4061 (x86_64), Display Driver: 32.0.12064.27, OpenCL:
OpenCL 2.1 AMD-APP (3628.0), File-System: NTFS, Screen Resolution: 3840x2160

Начнём с не слишком полезного Geekbench 6

Phoronix test suite
Так как я ненастоящий сварщик обзорщик, разобраться как все тесты валить в одну запись в базе пока не сдюжил
Кодирование из Av1 в разные качества кодека Av1 с помощью транскодера SVT
https://openbenchmarking.org/result/2505227-NE-PORTAL20141

https://openbenchmarking.org/result/2505217-NE-SMALLPT0104 - smallpt

https://openbenchmarking.org/result/2505218-NE-HASHCAT0141 - hashcat

Из интересных наблюдений: тенденция, что актуальная Ubuntu производительнее Windows 11 в десктопных задачах сохраняется https://openbenchmarking.org/result/2505077-NE-2505068NE32&sgm=1&sor&swl (не мой тест)

Конечно мы тут собрались не ради синтетики, а ради тестов в задачах локального инференса и тут как раз есть некая сложность в виде как я понял отсутсвия gfx1151 kernel для данного APU

Однако CPU инференс в LM Studio для lmstudio-community/Qwen3-235B-A22B-GGUF/Qwen3-235B-A22B-Q3_K_L-00001-of-00003.gguf
Позволил получить для запроса (Слова: 200 / Знаки с пробелами: ~1000)

4.10 tok/sec /1191 tokens / 2.93s to first token / Stop reason: EOS Token Found
Однако окно контекста забивается буквально от пары запросов, эксплуатировать такую модель для прикладных задач, а не ради факта локального инференса едва ли будет возможным

Что же касается генерации, то для этого потребуется поддержка GPU, так как процессор совершает менее 1 итерации в секунду, что слишком медленно не только для видео, но и для фото.

С вопросами и предложениями что ещё и как именно протестировать можно сюда

Железка прикольная, многое ещё предстоит в ней проверить, пожелания/предложения - welcome в комментарии

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

Лайфхак как убирать фризы и лаги на ПК с ОС Windows, если в играх начались жуткие тормоза, нажимаем:

Ctrl + Win + Shift + B

Эта комбинация полностью выгружает драйвер видеокарты из оперативной памяти и очищает её кэш.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

Энтузиасты YouTube-канала Budget-Builds Official запустили Minecraft на ПК с Windows XP, процессором Athlon 64 и видеокартой Pine 3D Phantom XP-2800 2005 года выпуска, которая основана на SiS-чипе и обладает всего 8 МБ видеопамяти.

Изначально версия Minecraft 1.6.4 загрузилась, но выдавала всего 1 кадр в секунду и через две минуты вылетала. Чтобы добиться хоть какой-то стабильности, пришлось отключить все эффекты — облака, туман и анимации, а также снизить разрешение до минимума и использовать пакет текстур 8x8, чтобы предотвратить вылет игры. Даже генерация мира была перенесена на отдельный ноутбук, чтобы повысить производительность. Также игра изначально работала в такой старой конфигурации только на CRT-мониторе.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии1

На YouTube-канале Tech YES City появился необычный эксперимент, в котором автор проверил, как разные версии Windows — 10 и 11 LTSC — ведут себя в современных играх.

Тесты проводились на мощном железе: PC с GeForce RTX 5090 и Radeon RX 9070 XT в разрешениях 1080p и 4K. Например, в Counter-Strike 2 обе версии Windows 10 LTSC — 2019 и 2021 (IoT) — обошли Windows 11 LTSC, причём разница сохранилась даже в 4K. Но здесь же обнаружился парадокс: Radeon RX 9070 XT в 1080p выдал больше кадров, чем RTX 5090, хотя в 4K Nvidia взяла верх.

Для фанатов CS2 и Fortnite оптимальна Windows 10 LTSC 2019, а владельцам свежих GPU, возможно, стоит обратить внимание на IoT-версию 2021 года. Но в некоторых проектах, особенно с упором на DirectX 12, выигрывает Windows 11 LTSC.

Теги:
Рейтинг0
Комментарии1

Ближайшие события

Эксперты Hardware Unboxed провели независимое тестирование новой видеокарты Nvidia RTX 5060 Ti в двух версиях — с 8 ГБ и 16 ГБ памяти. Результаты показали, что младшая модель заметно отстаёт в современных проектах, особенно при высоких настройках графики.

В таких играх, как The Last of Us Part II и Horizon Forbidden West, разрыв между версиями достигал 30–80% в разрешении 1440p и 4K. Например, при активации трассировки лучей в Hogwarts Legacy карта с 8 ГБ демонстрировала падение производительности почти в пять раз по сравнению со старшей моделью. Даже в менее требовательных сценариях, возникали резкие просадки до 7 кадров в секунду и вылеты из-за нехватки памяти.

Аналитики советуют избегать покупки RTX 5060 Ti 8 ГБ, несмотря на ее низкую стоимость. Для комфортной игры в разрешении 1080p карта подходит условно, но даже здесь наблюдаются подтормаживания.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии1

Nvidia начала продавать новые видеокарты RTX 5080 и 5090 из «фургона с едой» на своей конференции по технологиям GPU, где участники, заплатившие более $1000 за билет, могут приобрести графические адаптеры вместе с мерчем. Nvidia собирается так продать всего 2000 карт (по 1000 штук RTX 5080 и 5090) в течение трехдневной конференции.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Журналистам на выставке электроники CES 2025 дали подержать видеокарту Nvidia RTX 5090 в исполнении от ASUS ROG. Оказалось, что это очень большое и тяжёлое компьютерное устройство.

Ранее Nvidia презентовала графические адаптеры поколения RTX 50, в которое вошли четыре устройства на базе архитектуры Blackwell: GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070. Стоимость графических ускорителей варьируется от $550 до $2000.

Nvidia уверяет, что RTX 5090 будет в два раза быстрее RTX 4090, однако у неё вырастет энергопотребление, производитель указывает, что TDP флагманской видеокарты составит 575 Вт.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

По информации профильных источников, видеокарта Nvidia RTX 5070 будет на 30% мощнее 4070.

Начинка GeForce RTX 5070:

• Процессор: GB205-300 • Ядра CUDA: 6144 — 5888 у RTX 4070.

• Память: 12 ГБ GDDR7 — 12 ГБ GDDR6 у RTX 4070.

• Разрядность шины: 192 бит — 192 бит у RTX 4070.

• Энергопотребление: 250 Вт — 200 Вт у RTX 4070.

Начинка GeForce RTX 5070 Ti

• Процессор: GB203-300.

• Ядра CUDA: 8960 — 7680 у RTX 4070 Ti.

• Память: 16 ГБ GDDR7 — 12 ГБ GDDR6X у RTX 4070 Ti.

• Разрядность шины: 256 бит — 192 бит у RTX 4070 Ti.

• Энергопотребление: 300 Вт — 285 Вт у RTX 4070 Ti.

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии5

Компьютерная сборка от официального производителя с RTX 5090 будет стоить €6 тыс.

Немецкие продавцы случайно раскрыли цену ПК Acer Predator с новенькими RTX 5080 и 5090.

Сборки ПК будут следующие:

— RTX 5080, 32 ГБ оперативной памяти, SSD объёмом 1 ТБ и процессором Core Ultra 7 265K стоит €3,5 тыс..

— RTX 5090, 128 ГБ ОЗУ, SSD объёмом 2 ТБ и CPU Core Ultra 9 285K оценивается уже в 6€6 тыс. 

Как отмечает Videocardz, различия в системах с процессорами Core Ultra 9 и Core Ultra 7 затрудняют прямое сравнение для понятия стоимости RTX 5090 и 5080. Тем не менее, если предположить, что 128 ГБ памяти стоят €500, а разница в стоимости процессоров составляет €250, тогда разница между двумя видеокартами составляет €1750.

Эксперты предполагают, что представленные цены могут быть предварительными, однако характеристики соответствуют предыдущим утечкам, что подтверждает достоверность представленной информации.

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Intel не сдаётся: зачем компания представила новые видеокарты

Intel анонсировала видеокарты Arc B570 и B580, старшая модель уже поступила в продажу в США. Сначала модель подороже. Впрочем «подороже» — относительно, стоимость карт начинается в районе $250, что по нынешним меркам не дотягивает и до среднего ценового диапазона. На что надеется Intel?

Intel неоднократно запускала дискретные видеокарты, но каждый раз что-то мешало: то решила отдать приоритет встроенным в процессор видеокартам, то не хватало лицензий на технологии. Intel не сдалась и в 2022 году снова зашла на рынок. Выпуск видеоплат выглядит разумным. Они позволили Nvidia конкурировать с Microsoft и Apple, а AMD совершить спрут — поднять стоимость акций в 100 раз за 10 лет.

Концепция ARС — это недорогие видеоплаты, которые дополняют процессоры Intel и дают достаточную производительность. В новых моделях кроме современных игровых технологий также появились тензорные ядра XMX. Intel объясняет, что они позволяют делать картинку более плавной и поддерживать высокую частоту её обновления в играх. Но тензорные ядра обычно эффективны для обучения нейросетей.

Есть ли сомнения в успехе продукта Intel? Увы. Во-первых, компания терпит убытки и не сможет поддерживать низкие цены на видеокарты. Может, Intel умеет их делать по низкой себестоимости? И снова сомнения: Intel потеряла 40%-ную скидку от TSMC из-за высказываний о Тайване.

Возможно, Intel сможет сыграть на совместимости своих процессоров Intel Core и видеокарт Intel Arc, но будет очень интересно посмотреть, хватит ли этого.

Теги:
Всего голосов 13: ↑13 и ↓0+22
Комментарии1

GPU для сверточных нейросетей и быстрой обработки данных

В среду, 11 декабря, подключайтесь к бесплатному онлайн-митапу от сообщества C++ Russia. В программе всего два доклада — трансляция начнется в 17:00.

«Свертка на GPU и увеличение ее размерности»

Рассказывает: Кирилл Колодяжный (@Mik42), ведущий инженер по разработке ПО, YADRO

Вы познакомитесь с понятием свертки и ее доступными реализациями для NVIDIA GPU. Вместе с докладчиком рассмотрите различные алгоритмы расчета свертки: наивный алгоритм, FFT, GEMM (im2col/col2im), Winograd. Основное внимание уделим тому, как увеличить размерность свертки, так так сейчас наиболее распространена 3D-свертка.

Кирилл покажет простой подход к увеличению размерности с использованием PyTorch и расскажет, почему он не подошел. Также он поделится деталями реализации подхода на основе vol2col, расскажет, как тот позволяет масштабировать размерности и использовать быстрые реализации базовой операции GEMM с использованием cuBLAS и CUTLASS.

«GPU для ускорения фреймворка обработки слабоструктурированных данных Otterbrix: технологии, массивы и производительность»

  Александр Боргардт, техлид DuckStax 

Доклад посвящен ускорению обработки колоночных данных с использованием видеокарт. Александр рассмотрит применение GPU для оптимизации работы с массивами данных, характерных для фреймворка. Особое внимание уделим сравнительному анализу технологий CUDA и OpenCL с точки зрения их эффективности и применимости в данной области. Сравним производительность подходов в нескольких бенчмарках.

Особенно полезен доклад исследователям и специалистам в области высокопроизводительных вычислений, заинтересованных в использовании GPU для обработки больших объемов данных.

Кому подойдет митап: Организаторы ожидают, что участники понимают и могут читать код на С++. Если вы никогда не программировали GPU, на открытии будет введение в технологию.

Митап пройдет онлайн на платформах YouTube и VK Видео:

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0
1

Вклад авторов