Все потоки

Видеокарты

Графические адаптеры

61,86

Рейтинг

СтатьиПостыНовостиАвторыКомпании

voqse 24 июл в 07:40

Как превратить домашний сервер в игровой стриминг на любое устройство в доме

Средний

9 мин

11K

Игры и игровые консолиНастройка Linux * Серверное администрирование * Видеокарты

Туториал

Из песочницы

Мой игровой ПК с 5800×3D переехал в шкаф в прихожей и стал домашним сервером, а играю я теперь на телевизоре, Steam Deck и ноутбуке — стримом с него же. В этой статье расскажу, почему мне не подошла привычная связка Sunshine + Moonlight и как вместо неё поднять Wolf из проекта Games on Whales, о котором на русском, кажется, ещё не писали: свой виртуальный дисплей под каждого клиента, несколько сессий одновременно и никакого Steam на хосте. Отдельно — про главные грабли: с Wolf не работает официальный проброс NVIDIA‑драйвера, и после каждого обновления стриминг молча умирал, пока я не научил сервер чинить себя сам.

Читать далее

+23

TrexSelectel 20 июл в 08:00

История создания самодельной видеокарты на 8 192 ядра RISC-V из тысяч дешевых микроконтроллеров

7 мин

21K

Блог компании SelectelDIY или Сделай самВидеокартыГаджетыПроизводство и разработка электроники *

Немецкий разработчик с ником bitluni потратил около полугода на создание одной из самых необычных DIY-систем. Вместо того чтобы использовать готовый графический процессор или FPGA, он решил построить аналог графического ускорителя из 8 192 недорогих RISC-V микроконтроллеров. Их он объединил в единую иерархическую структуру.

Энтузиаст хотел показать, насколько далеко можно зайти, используя самые простые и доступные компоненты. По пути нашему герою пришлось решать задачи синхронизации тысяч микроконтроллеров, организации питания, автоматической прошивки и обмена данными между всеми узлами системы. Именно этим проект и интересен. Давайте посмотрим, что здесь и как работает.

Читать далее

+51

PetrUfa 19 июл в 23:10

Как мы запустили Ornith‑35B на ноутбуке с 8 ГБ VRAM и разогнали её до 99 ток/с на AMD Strix Halo

Средний

11 мин

13K

Машинное обучение * Open source * ВидеокартыLinux * Windows *

Туториал

Ornith‑1.0‑35B обошла Qwen3.5‑397B в Terminal‑Bench, а на нашем локальном срезе хорошо показала себя в агентном кодинге. Мы решили проверить, насколько быстрее она сможет работать на AMD Strix Halo с пропускной способностью памяти до 256 ГБ/с.

В статье — результаты экспериментов с Vulkan, MTP, селективной квантизацией и n‑gram reuse: что не дало прироста, как удалось получить 99 ток/с без потери качества и каким способом 35B‑модель запустилась на Windows‑ноутбуке с 8 ГБ VRAM.

Читать далее

+5

monobogdan 18 июл в 14:05

Тайна Intel i740 — самой экзотической видеокарты из 90-х

Средний

9 мин

22K

Блог компании Timeweb CloudВидеокартыИстория ITСтарое железоКомпьютерное железо

Ретроспектива

Ранее я часто рассказывал об особенностях видеокарт из 90-х. В рамках прошлых статей, мы успели с вами рассмотреть внутреннюю архитектуру 3dfx Voodoo, узнать о кастомном графическом API в S3 ViRGE, и даже написать свою собственную небольшую демку под видеокарты из 90-х. Вместо рассказов о GeForce 256 и ATi 3D Rage, в сегодняшнем материале мне хотелось бы поговорить о видеокарте, которая обогнала своё время — и при этом всё равно провалилась. Как вы уже поняли — речь пойдет об Intel i740.

Каким был первый GPU от Intel, на что он был способен и в чём заключается его главная тайна — читайте в сегодняшней статье!

Читать далее

+67

IAlexOps 18 июл в 08:00

vLLM vs LMDeploy vs Triton: обзор бэкендов для инференса LLM

Средний

25 мин

15K

Блог компании SelectelИскусственный интеллектПрограммирование * IT-инфраструктура * Видеокарты

Лучший способ сжечь бюджет компании на инфраструктуру — запуск LLM в продакшене. Но только если вы не знаете, какой бэкенд использовать и как его настраивать.

Проблема в том, что параметры современных нейросетей растут по экспоненте, а обрабатываемый контекст становится все длиннее. Из-за этого операционные расходы на генерацию текста превращаются в главный барьер для масштабирования сервисов. Обслуживать запросы к LLM в десятки раз сложнее и дороже, чем крутить классический поиск по ключевым словам. Чтобы не разориться на счетах и выжать максимум из дорогостоящих GPU, нужен специализированный софт.

В этой статье мы подробно сравним три ведущих бэкенда для инференса: vLLM, LMDeploy и экосистему NVIDIA Triton Inference Server в связке с TensorRT-LLM. Мы разберем, как они управляют памятью, какие методы квантования используют и как распределяют запросы, а также оценим результаты их бенчмарков на актуальных архитектурах NVIDIA Hopper и Blackwell.

Читать далее

+40

Dmitry_Dor 9 июл в 09:40

Запуск тяжелых 3D-игр на компьютере со слабой видеокартой — от теории к практике

Средний

25 мин

9.6K

3D-графика * ВидеокартыИгры и игровые консолиКомпьютерное железоСофт

Туториал

Вот уже несколько десятилетий идёт непрерывная борьба между требованиями игр к производительности компьютерного железа (и в первую очередь видеокарт) и возможностями самих видеокарт.

Создатели игровых движков внедряют всё более продвинутые визуальные технологии, разработчики игр на этой основе создают более реалистичные игровые проекты, а чипмейкеры, в свою очередь, разрабатывают новые архитектуры видеочипов, способных удовлетворить эти аппетиты.

При этом видеокарты устаревают намного быстрее других компьютерных компонентов. Если флагманский процессор пятилетней давности сейчас ещё выглядит вполне бодрым, то новейшая игровая видеокарта всего через несколько лет становится безнадёжно устаревшей, а вскоре превращается чуть ли не в офисную “затычку для слота”: новые игры в нативном разрешении монитора начинают заметно тормозить даже на не самых тяжёлых настройках.

Так что же делать, если ещё не совсем старая видеокарта пока не превратилась в “затычку для слота”, но уже на пути к этому (или если это пусть и новая, но встройка, которая по сравнению с дискретными видеокартами никогда и не была мощной), и какая-то новая игра в нативном разрешении монитора уже откровенно не тянет?

Конечно, можно уменьшить разрешение в настройках игры — например, запустив её в 1080p или даже 720p, однако на современных мониторах с цифровыми LCD- или OLED-панелями и простейшими апскейлерами это выглядит, мягко говоря, не слишком хорошо, и изображение превращается в мыльное шоу.

Попробуем поискать другие паллиативные решения:

Читать далее

+7

malyazin_2010 3 июл в 10:14

Запускаем LLM локально на майнинг ферме из 4 GPU

3 мин

14K

DevOps * DIY или Сделай самGPGPU * Natural Language Processing * Видеокарты

Кейс

В последнее время становится все более популярным локальный запуск LLM. У каждогг свои причины, но основные это: проблемы с западными сервисами, нестабильный интернет и утечка данных в открытый доступ (преценденты уже были).

В этой статье я расскажу как запускал LLM локально на майнинговом железе, какие тонкости есть при запуске. Расскажу архитектуру моей сборки и примерную стоимость железа. Также протестирую скорость работы с некоторыми наиболее популярными MoE LLM, включая модели от гугла и ChatGPT. По поводу целесообразности подобных сборок решение каждый примет сам исходя из своих задач и финансовых ресурсов.

Читать далее

+25

Xcom-shop 2 июл в 08:52

Почему говорят, что у AMD драйверы хуже, чем у NVIDIA

Простой

4 мин

8.8K

Блог компании Группа компаний X-ComВидеокарты

Мнение

Tom's Hardware в июне пересобрал рейтинг лучших игровых видеокарт. Инфоповод подхватили буквально все, но сам по себе он не так интересен, как один посыл, который дали авторы. Сначала они назвали лучшей картой высокого класса GeForce RTX 5070 Ti. А ее прямого конкурента, Radeon RX 9070 XT, удостоили далеко не самой лестной оценки. Причем не за скорость: AMD стоит почти на треть дешевле и в чистой растеризации отстает на считанные проценты. Вот только, по мнению издания, у AMD сырая экосистема и проблемные драйверы, что перевешивает всю выгоду в цене. Обвинять AMD в плохих драйверах в 2026 году довольно смело, особенно если вспомнить, что творилось у NVIDIA последние полтора года.

Читать далее

+8

yar3333 29 июн в 18:06

Дело на вечер: собираем домашний ИИ-сервер

Простой

2 мин

19K

ВидеокартыИскусственный интеллектКомпьютерное железо

Конечно, можно купить готовый (за ~1.3 млн. руб. есть неплохие варианты), но нам ведь главное процесс, ведь так? К тому же, не все готовы выложить такую сумму за возможность запускать дома нейронку. Итак, что нам пригодится, чтобы влезть в бюджет до 400 тыс. руб.:

Читать далее

+17

makart19 25 июн в 11:45

Как мы валидировали сервер YADRO для NVIDIA H100 Special

7 мин

11K

Блог компании YADROВидеокартыМашинное обучение * Искусственный интеллектIT-инфраструктура *

Недавно на рынке появились карты NVIDIA H100 в форм-факторе PCIe, построенные на основе извлеченных из HGX-модулей SXM-чипов. Но точно ли их производительность не уступает производительности оригинальных NVIDIA H100 NVL?

Меня зовут Артём Маклаев, вместе с командой я занимаюсь оценкой производительности серверных платформ для задач искусственного интеллекта в YADRO. В целях эксперимента мы решили сравнить показатели PCIe-карты NVIDIA H100 (дальше по тексту буду называть их NVIDIA H100 Special) и NVIDIA H100 NVL. Для этого провели испытания с использованием сервера YADRO G4208P G3. Методику построили так, чтобы результат можно было проверить и воспроизвести: для сравнения использовали одинаковую серверную платформу, одинаковые версии драйвера, CUDA и ОС, а также два уровня тестов — прикладной vLLM benchmark и NCCL all_reduce_perf для проверки GPU-интерконнекта.

В статье покажу результаты бенчмарков на типовых LLM-конфигурациях и дам рекомендации, как валидировать ускорители перед включением в проектный или продуктовый контур. Будет полезно, если приобретаете карты для работы над задачами ИИ.

Читать далее

+21

skovalev 23 июн в 08:01

Tensordyne Napier — еще одно решение на замену традиционных GPU в инференсе

Простой

6 мин

13K

Блог компании SelectelIT-компанииIT-инфраструктура * ВидеокартыКомпьютерное железо

Аналитика

Почти каждый месяц очередной стартап, производящий серверное железо, объявляет о своих ноу-хау. Естественно, ориентированных на задачи инференса и обучения ML-моделей. И пусть до реального использования в дата-центрах доходит лишь малая их часть, мы стараемся следить за всеми апдейтами, чтобы не пропустить ту новинку, которая, возможно, изменит рынок. С вами Сергей Ковалёв, менеджер продукта Selectel, а под катом вас ждут подробности об очередной чудо-железке.

Читать далее

+54

TrexSelectel 20 июн в 08:00

Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты

Простой

6 мин

17K

Блог компании SelectelИскусственный интеллектСтарое железоOpen source * Видеокарты

Аналитика

В последние годы купить новую видеокарту стало заметно сложнее и дороже. Одной из причин стал бурный рост систем искусственного интеллекта, для которых требуются огромные объемы вычислительных ресурсов. Крупные компании активно скупают графические ускорители для своих дата-центров, что влияет и на обычный рынок. В результате многие владельцы компьютеров не спешат с обновлением и продолжают использовать уже имеющееся железо или ищут недорогие варианты на вторичном рынке.

В мире open-source эта ситуация привела к довольно неожиданному результату. Разработчики Linux продолжают поддерживать видеокарты, которым уже почти два десятилетия, адаптируя драйверы под современные версии системы. Любопытно, что помогает им в этом технология, которую многие считают одной из причин нынешнего дефицита ускорителей, — генеративный искусственный интеллект. Недавняя история с доработкой драйвера для видеокарт AMD, выпущенных еще в 2007–2010 годах, наглядно показывает, как подобные инструменты используются в реальной разработке. Мы уже писали новость об этом, а теперь давайте разберемся подробнее.

Читать далее

+50

Lompushka 17 июн в 12:36

Нейросетевой эквалайзер на PlutoSDR: от синтетики к железу

Средний

4 мин

7.2K

Беспроводные технологии * TensorFlow * ВидеокартыВосстановление данных *

Кейс

Из песочницы

Любой реальный радиоканал «размазывает» символы во времени: соседние отсчёты накладываются друг на друга, и приёмник видит межсимвольную интерференцию (ISI). Классический способ с этим бороться — адаптивный фильтр LMS. Он прост, дёшев и хорошо работает, пока канал близок к линейному. Но это именно линейный фильтр: когда лучей несколько и у них разные фазы, одной линейной комбинацией отсчётов идеально восстановить символ уже не получается.

Отсюда идея, которую я и проверял: заменить (или дополнить) LMS компактной свёрточной сетью. Сеть смотрит не на один отсчёт, а на целое окно принятого сигнала и учится по нему обратному отображению канала — то есть восстанавливать исходную точку созвездия с учётом совместной статистики соседних символов. Сначала всё это обучается и сравнивается на синтетике, а потом проверяется на настоящем железе — модуле ADALM‑PLUTO.

Читать далее

+8

Wolfram0108 9 июн в 15:28

Рабочий стол в LXC-контейнере: детективная история о протоколах, тупиках и самописном Wayland-композиторе

24 мин

12K

DevOps * Linux * ВидеокартыВиртуализация *

Ретроспектива

Из песочницы

Домашний облачный рабочий стол и гейминг в контейнере, с общим GPU. Готового решения не было — пришлось пройти четыре тупика и написать свой Wayland-композитор.

Читать исследование

+27

Bright_Translate 5 июн в 13:01

Как я установил в свой игровой ПК серверный GPU за £200

Средний

10 мин

22K

Блог компании RUVDS.comВидеокартыКомпьютерное железоМашинное обучение * Искусственный интеллект

Туториал

Перевод

У меня уже была установлена RTX 4080 с 16 ГБ VRAM. Её вполне достаточно для гейминга, но не для моделей, которые я хотел запускать локально. Так что следующим шагом было либо приобретение дорогущей карточки с большим объёмом памяти, либо поиск другого способа.

И я этот способ нашёл.

Я купил видеокарту для датацентра, у которой даже нет нормального коннектора PCIe, и подключил её к ПК через адаптер. Теперь у меня в системе 32 ГБ VRAM от двух GPU, на которых работает модель с 27 миллиардами параметров, выдавая по 32 токена в секунду. И обошлось мне это всего в £200.

Читать далее

+83

Chimera87 2 июн в 11:34

Настоящий медный custom

18 мин

17K

ПроцессорыКиберпанкВидеокартыКомпьютерное железоDIY или Сделай сам

Кейс

Из песочницы

Сезон DIY | Лемана Тех х Хабр

Что делать, если акрил кажется слишком хрупким, шланги мутнеют, а твоя RTX 4080 воет под нагрузкой?

Правильно! Взять полтора метра 15миллиметровой водопроводной меди, газовую горелку, собрать плоскошлифовальный станок из дрели и построить бесшумный реактор вопреки всем проблемам, которые препятствуют этому....

Читать далее

+55

beatwad 27 мая в 07:07

Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Сколько ресурсов нужно для LLM?

Средний

8 мин

6.8K

Анализ и проектирование систем * ВидеокартыИскусственный интеллектМашинное обучение *

Перевод

Это продолжение цикла статей о масштабировании тренировки и инференса LLM.

Предыдущая статья

А теперь перейдем к чему-то более практическому, а именно к тому, сколько нужно FLOPs и байт для работы трансформера. Подразумевается, что у вас уже есть представление о том, что такое архитектура трансформера, как работает механизм внимания и т.д.

Давайте начнем с векторов x, y и матриц A, B, имеющих вот такие размеры, допустим один элемент занимает при этом один байт.

Читать далее

0

Myskat_90 26 мая в 07:30

DRAйверы для GPU: как Kubernetes научился выделять устройства через стандартный API

Сложный

20 мин

8.4K

Блог компании ФлантИскусственный интеллектKubernetes * IT-инфраструктура * Видеокарты

Device Plugin в Kubernetes сводит GPU к счётчику на узле: планировщик видит только количество устройств, но не их профиль, объём памяти или режим шаринга. Для ML-задач это быстро становится ограничением. Обучению нужны выделенные карточки целиком, инференсу — управляемые доли, а CI хватит и четвертинки NVIDIA H100 на пять минут.

Dynamic Resource Allocation полностью меняет модель управления устройствами. GPU становятся сущностью с инвентарём, атрибутами и правилами выбора. В статье я разбираю устройство DRA и показываю миграцию с device plugin на примере кластера из 8 узлов × 8 NVIDIA H100 без полного переписывания манифестов. А ещё объясняю, почему мы в Deckhouse пишем свой DRA-драйвер.

Разобраться с DRA

+15

ha7y 25 мая в 20:04

20 лет видеокарт в цифрах: как росли FLOPS и TDP и кто вёл в дуэли NVIDIA vs AMD (+ открытый датасет на 13 500 GPU)

Средний

5 мин

11K

Видеокарты

Аналитика

Мы свели в одну базу характеристики 13 566 видеокарт — от GeForce 256 (1999) до Blackwell и MI355X (2025) — и посмотрели, как за 20 лет менялась индустрия, а не отдельные карты. FP32 флагманов вырос примерно в 400 раз, теплопакет дополз со 155 до 1400 Вт, зато производительность на ватт — в ~100 раз. По годам разобрали, кто на самом деле вёл в дуэли NVIDIA против AMD (спойлер: «сырой FP32» — метрика обманчивая, и AMD лидировала чаще, чем принято думать), и почему настоящая битва давно ушла в tensor-вычисления. А весь очищенный датасет (CSV + SQLite, 13.5k GPU + бенчмарки) выложили открыто под CC BY 4.0 — забирайте и копайте с нами.

Читать далее

+10

Yuiy78 25 мая в 15:04

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

Средний

12 мин

13K

Искусственный интеллектВидеокартыНастольные компьютерыСтарое железоКомпьютерное железо

Обзор

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 - Запуск локальных моделей ИИ

Читать далее

+15

1

2 3 ...