Обновить
31.82

Видеокарты

Графические адаптеры

Сначала показывать
Порог рейтинга
Уровень сложности

Сначала я не поверил глазам: GPT-5.3-Codex-Spark выдает код моментально. Cerebras просто засунул память внутрь чипа

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели6.6K

Внимание, розыск! Пропала задержка инференса. Последний раз ее видели с чипом Cerebras.

Пока все следили за гонкой вооружений в мире LLM – кто кого переплюнет по количеству параметров, – OpenAI взяла и сделала неожиданный ход. Они выпустили модель, которая даже не новая, но работает в 20 раз быстрее конкурентов. GPT-5.3 Codex Spark летает. Буквально.

И тут возникает вопрос: а на чём она, собственно, летит? Оказалось, что “двигатель” для неё поставила не Nvidia, а компания с безумной, на первый взгляд, идеей – использовать процессор размером с кремниевую пластину.

Проблема современных GPU в том, что они вынуждены постоянно “танцевать” с памятью, тратя время на пересылку данных туда-обратно. Cerebras предложила радикальное решение: убрать “танцпол” и заставить память и вычисления жить в одном доме – на огромном кристалле размером с пластину.

Как инженерам удалось обуздать производственные дефекты, нагревание и законы физики, чтобы достичь скорости 1000 токенов/с, и почему это не панацея для ИИ-агентов – разбираемся в статье.

Приятного погружения в мир wafer-scale-инженерии!

Читать далее

Новости

Сравнение DLSS 4.5 и FSR 4, или как играть в 4К с высоким fps, если железо не тянет

Время на прочтение4 мин
Охват и читатели7.3K

Помните, как пару лет назад FSR от AMD выглядела как спаситель владельцев бюджетных видеокарт? Ее можно было запустить на любом железе, а качество картинки, хоть и уступало DLSS, но оставалось вполне приемлемым, если сильно не придираться. Теперь же ситуация изменилась. NVIDIA выпустила DLSS 4.5, а AMD все еще сидит на FSR 4 без обновлений. Неужели «зеленые» окончательно оторвались от конкурента, или AMD все еще есть что предложить? Давайте разбираться, насколько велика разница между технологиями в реальных играх.

Читать далее

Anthropic против OpenAI: два разных подхода к «быстрому режиму»

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.5K

Anthropic и OpenAI почти одновременно запустили «быстрый режим» для своих моделей — и за одинаковым названием скрываются принципиально разные подходы к ускорению инференса.

В одном случае это реальная модель с уменьшенным батчингом, в другом — отдельная, более компактная версия на специализированных чипах Cerebras.

Разбираемся, что именно стоит за цифрами «2.5×» и «1000 токенов в секунду», где компромисс по качеству и что это значит для разработчиков на практике.

Читать далее

Правда ли, что Nvidia останавливает производство почти всех видеокарт, кроме RTX 5050? Как обстоят дела на самом деле

Время на прочтение4 мин
Охват и читатели4.8K

Несмотря на всеобщие увещевания о тотальном дефиците оперативной памяти, глобальной катастрофы многие даже не заметили. Да, планки DDR5 на 64 ГБ стали дороже. Но так их и не покупал почти никто. Ну, или покупал, но нечасто. Главное – что на DDR4 непосильными цены не стали. Но вот когда Nvidia решила снять с производства половину модельного ряда видеокарт, многие призадумались. 

Читать далее

Как выбрать ноутбук и не обжечься: рассказываем, куда смотреть

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели11K

Бешеный ритм современной жизни диктует свои условия — мы живем и работаем «на бегу», так что ноутбук под мышкой — уже привычное для многих дело. Рынок, в свою очередь, не отстает — на полках магазинов тысячи вариантов лэптопов и выбрать стоящий неподготовленному человеку сложно. 

Эта статья поможет не утонуть в характеристиках, отделить зерна от маркетинговых плевел и купить устройство, которое справится с поставленными задачами, без переплат за ненужное.

Читать далее

Бенчмарк DGX Spark с LLM Qwen3: кому подойдет, почему 128 ГБ не серебряная пуля и о чем умолчал маркетинг NVIDIA

Уровень сложностиСредний
Время на прочтение21 мин
Охват и читатели7.6K

У всех кто работает с LLM моделями случалось, что модель на 32B параметров не влезает в 24 ГБ VRAM вашей RTX 4090, offload на CPU убивает скорость, а облако — дорого и данные уходят на сторону. NVIDIA обещает нам решение: DGX Spark (он же GB10) с 128 ГБ unified memory за ~400-500 тысяч рублей. Мы потратили две недели на глубокие бенчмарки устройства и результаты оказались... неоднозначными.

В статье будет много графиков, сравнение нескольких форматов квантизации, тесты разных объемов подаваемого контекста, сравнения с более привычными GPU и оценка финансовой эффективности такой покупки. Цель бенчмарка разобраться, в каких ситуациях DGX Spark показывает свои преимущества, а где его архитектурные ограничения становятся узким местом и предпочтительнее выбирать другие решения.

Открыть бенчмарк

OpenCL, SYCL и матрицы

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели9K

В данной статье я описываю свой опыт разработки приложений с OpenCL/SYCL.

Вычисления на видеокартах ассоциируются преимущественно с графикой, научными вычислениями и с недавних пор с нейросетями. Но чаще всего с графикой.

Тем не менее, графические процессоры обладают свойствами, за счёт которых их очень удобно использовать в задачах, напрямую не связанных с перечисленным выше. И главное из этих свойств – массовый параллелизм.

Самый краткий ввод в гетерогенное программирование: у нас есть две роли — хост и девайс, задача хоста – формировать задачи и отдавать их на девайс, в то время как задача девайса обработать их и вернуть результат. При этом хост и девайс могут быть одним вычислительным устройством (это не обязательно CPU + GPU, так как CPU может отдавать задачи сам себе).

Читать далее

Rubin + Helios: новые GPU-платформы от NVIDIA и AMD в дайджесте за январь

Время на прочтение10 мин
Охват и читатели11K

Январь в мире железа обычно месяц сонный, но в этот раз все пошло не по плану — сразу два топовых вендора показали свои флагманские продукты. 

Всем привет! С вами Сергей Ковалёв, менеджер выделенных серверов в Selectel. В этом дайджесте я собрал подробности самых нашумевших железных новинок за январь — от GPU до новых дисков и сетевого оборудования. Подробности под катом!

Читать далее

Видеокарты все чаще становятся предметом мошенничества

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.1K

Некоторое время назад на Amazon разыгралась история, которая показывает, почему не стоит верить слишком заманчивым предложениям. Казалось бы, прошло и забыли, но подобные случаи повторяются, и поэтому об этом стоит поговорить еще раз. Особенно когда компоненты стремительно дорожают, а купить по старой цене становится все более привлекательным. В том конкретном случае десятки покупателей вместо GeForce RTX 5090 за 999 долларов (уже странно) получили поясные сумки сомнительного качества. Вот и давайте разберемся, как работает эта схема.

Читать далее

Как GPU навсегда изменили мир кино и как создавали спецэффекты раньше

Время на прочтение14 мин
Охват и читатели10K

Кино всегда стремилось показать невозможное: исчезающие люди, фантастические места, инопланетные существа и миры, которых никогда не существовало. Задолго до компьютеров спецэффекты создавались руками — с помощью зеркал, дыма, макетов, оптических трюков и кропотливой работы художников. Однако по мере того как зритель привыкал к чуду, кино сталкивалось с пределами физического мира: миниатюры ломались, декорации стоили дорого, а сложные сцены требовали месяцев подготовки ради нескольких секунд экранного времени.

Сегодня за визуальной магией кино стоят не только режиссеры и художники, но и серверные стойки и целые фермы графических процессоров. GPU — когда-то вспомогательное устройство для вывода картинки — превратился в ключевой инструмент медиаиндустрии. Чтобы понять, почему современные спецэффекты выглядят именно так, нужно оглянуться назад и проследить, как эволюция железа шаг за шагом меняла сам язык кино.

Читать далее

На что способна новая видеокарта NVIDIA с 72 ГБ VRAM

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели12K

72 ГБ видеопамяти – еще пару лет назад такая цифра казалась абсурдной даже для серверных GPU. Топовые GeForce обходились 24 ГБ, а профессиональные карты держались в районе 48. Казалось бы, наращивать объемы сейчас, когда рынок изнывает от дефицита памяти, – не лучшее время. Но NVIDIA это не помешало взять и выкатить новую карточку RTX PRO 5000 с 72 ГБ GDDR7. Вопрос напрашивается сам собой: кому вообще может понадобиться столько памяти? И главное, что можно делать с таким объемом?

Читать далее

Плата с «повернутым сокетом» и серверы с жидкостным охлаждением: что подарил рынок под Новый год

Время на прочтение8 мин
Охват и читатели13K

На декабрь пришлись не только подготовка к праздникам, но и интересные «железки» от вендоров. Здесь у нас и технологии жидкостного охлаждения, развитие продуктов на базе AMD, и компоненты демократичных сегментов. А еще — планы на 2026 год, по которым Adlink подготовили материнскую плату для еще невышедшего процессора.

Привет, Хабр! На связи Сергей Ковалёв, менеджер выделенных серверов в Selectel. В этом дайджесте собрал самые нашумевшие железные новинки за декабрь — от GPU и десктопных материнских плат до серверных платформ и сетевого оборудования. Подробности под катом!

Читать далее

Как я решил проблему длинных совещаний вайбкодингом и китайской видеокартой

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели9.8K

Еще одна статья про whisper + pyannote для транскрибации совещаний?

Да, но нет.

Это сказ скорее про то, что в 2025-2026 году тот, кто раньше не кодил, может а скорее и должен(если ему конечно это в кайф) разрабатывать продукты под себя, свою команду, именно те, что нужны а не брать что дают...

Читать далее

Ближайшие события

Ну, LLM, погоди…

Уровень сложностиПростой
Время на прочтение22 мин
Охват и читатели14K

В этой статье я делюсь личным опытом выбора платформы для локального инференса (запуска) LLM. Формат - дневник инженера: детали, цифры и грабли вперемешку с эмоциями и выводами по ходу дела. Это не энциклопедия, и, совершенно точно, не "единственно правильный" рецепт, но, надеюсь, статья сэкономит время тем, кто сейчас решает, на каком железе и каким способом запускать модели.

Для тех, кто не готов погружаться в цепочку событий, сразу зафиксирую итог...

Читать далее

Что показали вендоры в 2025 году? Самые интересные железные новинки

Время на прочтение12 мин
Охват и читатели12K

Каждый месяц мы публиковали дайджесты с обзорами новинок серверного железа — от процессоров до систем хранения. И настало время подвести итоги и выделить, какие компоненты действительно задали вектор развития индустрии.

Привет! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этой статье я собрал самые интересные видеокарты, процессоры, диски и другие технологии за 2025 год. Подробности под катом!

Узнать подробности

Рабочие станции для ML и Data Science — как собрать сервер под столом

Уровень сложностиСложный
Время на прочтение20 мин
Охват и читатели19K

Внимание: опасный эксперимент! Когда я впервые решил собрать домашний ML-сервер, всё казалось простым: взять мощный ПК, всунуть две RTX 4090 – и вперед, нейросетки летят. Реальность быстро заставила меня попотеть. Оказалось, что сборка AI-фермы под столом – это совсем не то же самое, что собрать игровой ПК. Это отдельное приключение со своими подводными камнями. У меня до сих пор сохранился лёгкий тик от слова «TDP», а шрам на пальце напоминает о сгоревшем проводе. Но обо всём по порядку.

Читать далее

Большим GPU не нужны большие PC

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели18K

С тех пор, как я научил графические карты AMDIntel и Nvidia работать с Raspberry Pi, меня мучил вопрос:

Какой в этом смысл?

У Raspberry Pi есть только одна линия шины PCIe Gen 3, доступная для подключения к eGPU. Этого очень мало, особенно учитывая, что у современного десктопа есть как минимум один разъём с 16 линиями шины PCIe Gen 5. То есть разница составляет 8 Гт/с (гигатранзакций/с) против 512 Гт/с. Бой явно неравный.

Но мне стало любопытно, действительно ли пропускная способность шины важна всегда.

Я хотел наконец покончить с вопросом о полезности, протестировав четыре задачи на разнообразных GPU для сравнения производительности на Raspberry Pi 5 и на современном десктопном PC.

Читать далее

Как кризис оперативной памяти повлияет на видеокарты и консоли новых поколений

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

Все уже в курсе, что цены на оперативную память взлетели до небес. DDR5-комплекты, которые еще в сентябре стоили вполне разумных денег, теперь продаются втридорога. Но это еще цветочки. Гораздо хуже то, что текущий кризис памяти может серьезно повлиять на выход будущих видеокарт и консолей следующего поколения. Речь идет не только о повышении цен, но и о возможных задержках или даже отмене целых линеек продуктов. В худшем случае 2026 год вообще может пройти без новых GPU. Все это звучит как сюжет для антиутопии, но давайте разберемся, что происходит на самом деле.

Читать далее

Сколько VRAM нужно для нейросетей?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели19K

Этот пост будет полезен людям, кто хочет разобраться в локальных моделях, особенно использующим их, как инструмент в создании контента, арта и дизайна (контекст нейросетей - image и video). Так же поговорим о выборе видеокарты и параметрах влияющих на генеративные workflow.

Telegram

Читать далее

Сколько на самом деле стоит один fps в компьютерных играх в 2025 году: считаем выгоду от видеокарт

Время на прочтение10 мин
Охват и читатели7.8K

Помните времена, когда за 30 тысяч можно было купить приличную видеокарту? Ну вот они, собственно, никуда и не делись. Вопрос только в том, что именно вы считаете приличной картой и на какой фреймрейт рассчитываете. Благо, что недостатка в выборе на рынке сегодня практически нет. Хотите – берите RTX 5080 за 170 тысяч рублей. А не хотите – покупайте Arc A380 за 11. И это мы еще не говорим про промежуточные варианты в разных исполнениях, которых насчитываются десятки, если не сотни. Но есть ли смысл переплачивать за более дорогую карточку, когда есть почти такая же, только дешевле? Попробуем посчитать.

Дисклеймер: в этой статье мы считаем только цену каждого кадра, который выдают конкретные видеокарты, не затрагивая другие аспекты. Но ведь все знают, что fps – это далеко не единственный фактор, на который стоит обращать внимание.

Читать далее
1
23 ...