+10% к производительностисервера с конфигурацией AR45-NVMe
Нужна высокая производительность на одном узле, но серверная платформа не по бюджету и избыточна? AR45-NVMe — готовый сервер с передовым десктопным CPU, локальной сетью и быстрыми NVMe-дисками. Решение спроектировано именно для таких задач. Предложение ограничено, успейте заказать сервер по ссылке —>
Характеристики:
CPU: AMD RyzenTM 9 9950X, 16 ядер, до 4.3 ГГц;
RAM: 192 ГБ DDR5 (non-ECC);
Диск: 2×2000 ГБ SSD NVMe M.2;
Сеть и сервис: 1 Гбит/с приватная сеть, безлимитный трафик, SLA 99.8%,защита от DDoS, 24/7 поддержка, 3 часа на замену комплектующих.
Из чего состоит прирост производительности +10%
Высокая частота сокращает задержки в задачах, где важна оперативность: сборки, компиляции, отладки и CI-прогоны реагируют быстрее, потому что ядра решают мелкие задачи быстрее.
Больше RAM значит реже подкачка на диск, меньше простоев из-за swapping и стабильнее in-memory вычисления при аналитике и прототипировании ML.
Низкая задержка и высокая пропускная способность, плюс рост числа операций ввода-вывода в секунду (IOPS). Они ускоряют доступ к временным файлам, БД и scratch-пространству. Которые при хранении в сетевом сторадже тормозят работу.
GPU H200 в новой конфигурации выделенных серверов уже в Selectel
NVIDIA H200 — одна из самых мощных видеокарт для задач искусственного интеллекта с 141 ГБ памяти. В новой конфигурации — восемь GPU в формате SXM. Карты могут обмениваться данными на скорости до 4,8 Тбайт/сек. Поэтому конфигурация точно подходит для машинного обучения и инференса LLM.
Практическое применение:
Можно загружать большие параметры и контексты без постоянного свопа на диск — 141 ГБ vRAM в каждой карте позволяют работать с моделями и батчами, которые раньше требовали шардинга.
Высокая пропускная способность памяти (4.8 ТБ/с) ускоряет подачу данных в тензорные ядра для быстрого обучения и инференса больших языковых моделей и повышения скорости обработки токенов.
NVLink и SXM-формат минимизируют накладные расходы на обмен между GPU, что критично для крупных распределенных пайплайнов.
Selectel уже предлагает конфигурации с современными GPU и серверными платформами и готов собирать выделенные решения под H200-платформы. Берите в аренду 8×H200 в проверенной инфраструктуре вместо покупки и обслуживания собственного кластера.
Мы расширили линейку GPU-карт, которые можно арендовать за рубль при создании кастомных конфигураций выделенных серверов. Список видеокарт пополнила NVIDIA RTX А2000.
Низкопрофильный дизайн позволяет установить GPU в самый компактный корпус сервера, а память GDDR6 с коррекцией ошибок — защитить данные и сохранить точность расчетов.
Какие особенности у RTX А2000
6 ГБ высокоскоростной памяти GDDR6 с ECC,
104 тензорных ядра четвертого поколения,
3 328 ядра CUDA третьего поколения.
Карта подходит, например, для сложных ML-задач, видеомонтажа и работы с графикой.
В облачную платформу Рег.ру добавили новые GPU NVIDIA A4000. Теперь можно решить еще больше запросов на выгодных условиях: от 3D-моделирования и работы в CAD-программах до сложных вычислений и обучения ИИ-моделей. Облачные серверы с GPU позволяют быстро получать результат без собственного оборудования и работают по системе Pay-as-you-go.
Также напомним, что в Облаке Рег.ру доступны видеокарты NVIDIA: А5000 24Гб и А100 80Гб. Попробовать новые NVIDIA A4000 можно уже на сайте.
Для тестирования GPU-сервера YADRO G4208P G3 в конфигурации с восемью Н100 NVL / RTX 4090 мы выбрали бенчмарк на основе реализации обучения для модели GPT-2 на 1,558 миллиарда параметров из репозитория проекта llm.c Андрея Карпаты.
Эта модель была представлена OpenAI в блоге Better Language Models and Their Implications в феврале 2019 года. Тогда для ее обучения требовались команда инженеров и десятки топовых V100, а процесс длился неделями.
Сейчас, шесть лет спустя, достаточно одного сервера с восемью картами H100, а обучение занимает 1–1,6 суток. Все это благодаря развитию GPU, современным библиотекам, таким как CUDA и cuDNN, а также открытым датасетам типа FineWeb-Edu.
Андрей Карпаты показывает, что это возможно даже без фреймворков вроде PyTorch или TensorFlow. Все обучение реализовано примерно в 5 тысячах строк на C и CUDA.
Мы проверили, как справляются серверы YADRO c обучением GPT-2 на 1,6 миллиарда параметров. Обучение на конфигурации G4208P с восемью H100 NVL заняло 38 часов, или примерно 1.6 суток. На графике ниже показываем соотношение времени исполнения 50 шагов обучения на конфигурации G4208P с RTX 4090 по сравнению с конфигурацией на Н100 NVL:
Артём Маклаев с командой, которая занимается оценкой производительности серверных платформ для ИИ-задач в YADRO, поделился в статье результатами десятка тестов GPU-сервера с 8x Н100 NVL / RTX 4090: от инференса моделей распознавания речи до обучения LLM.
Сразу оговорюсь, что пока ко мне едет второй диск под отдельную систему, все тесты представленные ниже проведены на поставляемой в комплекте Windows 11 Pro Сборка 26100.4061 Adrenalin Edition 24.20.64 (Драйверы от AMD) HIP 6.2.4
Что в коробке с Gmktec Evo X-2
Processor: AMD RYZEN AI MAX+ 395 @ 3.00GHz (16 Cores / 32 Threads), Motherboard: GMKtec (1.04 BIOS), Memory: 8 x 16384MB 8000MHz Micron MT62F4G32D8DV-023 WT, Disk: 1908GB ADATA LEGEND 900, Graphics: AMD Radeon 8060S 4GB, Audio: Senary Audio + AMD Streaming Audio Device + AMD HD Audio Device, Monitor: LG ULTRAINE, Network: ASIX AX88179 USB 3.0 Gigabit + Realtek Gaming 2.5GbE + Bluetooth Device (Personal Area ) OS: Microsoft Windows 11 Pro Build 26100, Kernel: 10.0.26100.4061 (x86_64), Display Driver: 32.0.12064.27, OpenCL: OpenCL 2.1 AMD-APP (3628.0), File-System: NTFS, Screen Resolution: 3840x2160
Phoronix test suite Так как я ненастоящий сварщик обзорщик, разобраться как все тесты валить в одну запись в базе пока не сдюжил Кодирование из Av1 в разные качества кодека Av1 с помощью транскодера SVT https://openbenchmarking.org/result/2505227-NE-PORTAL20141
Конечно мы тут собрались не ради синтетики, а ради тестов в задачах локального инференса и тут как раз есть некая сложность в виде как я понял отсутсвия gfx1151 kernel для данного APU
Однако CPU инференс в LM Studio для lmstudio-community/Qwen3-235B-A22B-GGUF/Qwen3-235B-A22B-Q3_K_L-00001-of-00003.gguf Позволил получить для запроса (Слова: 200 / Знаки с пробелами: ~1000)
4.10 tok/sec /1191 tokens / 2.93s to first token / Stop reason: EOS Token Found Однако окно контекста забивается буквально от пары запросов, эксплуатировать такую модель для прикладных задач, а не ради факта локального инференса едва ли будет возможным
Что же касается генерации, то для этого потребуется поддержка GPU, так как процессор совершает менее 1 итерации в секунду, что слишком медленно не только для видео, но и для фото.
С вопросами и предложениями что ещё и как именно протестировать можно сюда
Железка прикольная, многое ещё предстоит в ней проверить, пожелания/предложения - welcome в комментарии
Энтузиасты YouTube-канала Budget-Builds Official запустили Minecraft на ПК с Windows XP, процессором Athlon 64 и видеокартой Pine 3D Phantom XP-2800 2005 года выпуска, которая основана на SiS-чипе и обладает всего 8 МБ видеопамяти.
Изначально версия Minecraft 1.6.4 загрузилась, но выдавала всего 1 кадр в секунду и через две минуты вылетала. Чтобы добиться хоть какой-то стабильности, пришлось отключить все эффекты — облака, туман и анимации, а также снизить разрешение до минимума и использовать пакет текстур 8x8, чтобы предотвратить вылет игры. Даже генерация мира была перенесена на отдельный ноутбук, чтобы повысить производительность. Также игра изначально работала в такой старой конфигурации только на CRT-мониторе.
На YouTube-канале Tech YES City появился необычный эксперимент, в котором автор проверил, как разные версии Windows — 10 и 11 LTSC — ведут себя в современных играх.
Тесты проводились на мощном железе: PC с GeForce RTX 5090 и Radeon RX 9070 XT в разрешениях 1080p и 4K. Например, в Counter-Strike 2 обе версии Windows 10 LTSC — 2019 и 2021 (IoT) — обошли Windows 11 LTSC, причём разница сохранилась даже в 4K. Но здесь же обнаружился парадокс: Radeon RX 9070 XT в 1080p выдал больше кадров, чем RTX 5090, хотя в 4K Nvidia взяла верх.
Для фанатов CS2 и Fortnite оптимальна Windows 10 LTSC 2019, а владельцам свежих GPU, возможно, стоит обратить внимание на IoT-версию 2021 года. Но в некоторых проектах, особенно с упором на DirectX 12, выигрывает Windows 11 LTSC.
Эксперты Hardware Unboxed провели независимое тестирование новой видеокарты Nvidia RTX 5060 Ti в двух версиях — с 8 ГБ и 16 ГБ памяти. Результаты показали, что младшая модель заметно отстаёт в современных проектах, особенно при высоких настройках графики.
В таких играх, как The Last of Us Part II и Horizon Forbidden West, разрыв между версиями достигал 30–80% в разрешении 1440p и 4K. Например, при активации трассировки лучей в Hogwarts Legacy карта с 8 ГБ демонстрировала падение производительности почти в пять раз по сравнению со старшей моделью. Даже в менее требовательных сценариях, возникали резкие просадки до 7 кадров в секунду и вылеты из-за нехватки памяти.
Аналитики советуют избегать покупки RTX 5060 Ti 8 ГБ, несмотря на ее низкую стоимость. Для комфортной игры в разрешении 1080p карта подходит условно, но даже здесь наблюдаются подтормаживания.
Nvidia начала продавать новые видеокарты RTX 5080 и 5090 из «фургона с едой» на своей конференции по технологиям GPU, где участники, заплатившие более $1000 за билет, могут приобрести графические адаптеры вместе с мерчем. Nvidia собирается так продать всего 2000 карт (по 1000 штук RTX 5080 и 5090) в течение трехдневной конференции.
Журналистам на выставке электроники CES 2025 дали подержать видеокарту Nvidia RTX 5090 в исполнении от ASUS ROG. Оказалось, что это очень большое и тяжёлое компьютерное устройство.
Ранее Nvidia презентовала графические адаптеры поколения RTX 50, в которое вошли четыре устройства на базе архитектуры Blackwell: GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070. Стоимость графических ускорителей варьируется от $550 до $2000.
Nvidia уверяет, что RTX 5090 будет в два раза быстрее RTX 4090, однако у неё вырастет энергопотребление, производитель указывает, что TDP флагманской видеокарты составит 575 Вт.
Компьютерная сборка от официального производителя с RTX 5090 будет стоить €6 тыс.
Немецкие продавцы случайно раскрыли цену ПК Acer Predator с новенькими RTX 5080 и 5090.
Сборки ПК будут следующие:
— RTX 5080, 32 ГБ оперативной памяти, SSD объёмом 1 ТБ и процессором Core Ultra 7 265K стоит €3,5 тыс..
— RTX 5090, 128 ГБ ОЗУ, SSD объёмом 2 ТБ и CPU Core Ultra 9 285K оценивается уже в 6€6 тыс.
Как отмечает Videocardz, различия в системах с процессорами Core Ultra 9 и Core Ultra 7 затрудняют прямое сравнение для понятия стоимости RTX 5090 и 5080. Тем не менее, если предположить, что 128 ГБ памяти стоят €500, а разница в стоимости процессоров составляет €250, тогда разница между двумя видеокартами составляет €1750.
Эксперты предполагают, что представленные цены могут быть предварительными, однако характеристики соответствуют предыдущим утечкам, что подтверждает достоверность представленной информации.
Intel не сдаётся: зачем компания представила новые видеокарты
Intel анонсировала видеокарты Arc B570 и B580, старшая модель уже поступила в продажу в США. Сначала модель подороже. Впрочем «подороже» — относительно, стоимость карт начинается в районе $250, что по нынешним меркам не дотягивает и до среднего ценового диапазона. На что надеется Intel?
Intel неоднократно запускала дискретные видеокарты, но каждый раз что-то мешало: то решила отдать приоритет встроенным в процессор видеокартам, то не хватало лицензий на технологии. Intel не сдалась и в 2022 году снова зашла на рынок. Выпуск видеоплат выглядит разумным. Они позволили Nvidia конкурировать с Microsoft и Apple, а AMD совершить спрут — поднять стоимость акций в 100 раз за 10 лет.
Концепция ARС — это недорогие видеоплаты, которые дополняют процессоры Intel и дают достаточную производительность. В новых моделях кроме современных игровых технологий также появились тензорные ядра XMX. Intel объясняет, что они позволяют делать картинку более плавной и поддерживать высокую частоту её обновления в играх. Но тензорные ядра обычно эффективны для обучения нейросетей.
Есть ли сомнения в успехе продукта Intel? Увы. Во-первых, компания терпит убытки и не сможет поддерживать низкие цены на видеокарты. Может, Intel умеет их делать по низкой себестоимости? И снова сомнения: Intel потеряла 40%-ную скидку от TSMC из-за высказываний о Тайване.
Возможно, Intel сможет сыграть на совместимости своих процессоров Intel Core и видеокарт Intel Arc, но будет очень интересно посмотреть, хватит ли этого.
GPU для сверточных нейросетей и быстрой обработки данных
В среду, 11 декабря, подключайтесь к бесплатному онлайн-митапу от сообщества C++ Russia. В программе всего два доклада — трансляция начнется в 17:00.
«Свертка на GPU и увеличение ее размерности»
Рассказывает: Кирилл Колодяжный (@Mik42), ведущий инженер по разработке ПО, YADRO
Вы познакомитесь с понятием свертки и ее доступными реализациями для NVIDIA GPU. Вместе с докладчиком рассмотрите различные алгоритмы расчета свертки: наивный алгоритм, FFT, GEMM (im2col/col2im), Winograd. Основное внимание уделим тому, как увеличить размерность свертки, так так сейчас наиболее распространена 3D-свертка.
Кирилл покажет простой подход к увеличению размерности с использованием PyTorch и расскажет, почему он не подошел. Также он поделится деталями реализации подхода на основе vol2col, расскажет, как тот позволяет масштабировать размерности и использовать быстрые реализации базовой операции GEMM с использованием cuBLAS и CUTLASS.
«GPU для ускорения фреймворка обработки слабоструктурированных данных Otterbrix: технологии, массивы и производительность»
Александр Боргардт, техлид DuckStax
Доклад посвящен ускорению обработки колоночных данных с использованием видеокарт. Александр рассмотрит применение GPU для оптимизации работы с массивами данных, характерных для фреймворка. Особое внимание уделим сравнительному анализу технологий CUDA и OpenCL с точки зрения их эффективности и применимости в данной области. Сравним производительность подходов в нескольких бенчмарках.
Особенно полезен доклад исследователям и специалистам в области высокопроизводительных вычислений, заинтересованных в использовании GPU для обработки больших объемов данных.
Кому подойдет митап: Организаторы ожидают, что участники понимают и могут читать код на С++. Если вы никогда не программировали GPU, на открытии будет введение в технологию.
Митап пройдет онлайн на платформах YouTube и VK Видео:
В наших облачных и выделенных серверах доступна карта RTX 2080 Ti.Благодаря высокой производительности она позволяет обучать нейросети, выполнять сложные вычисления в области ИИ, обрабатывать большие объемы данных и решать профессиональные графические задачи, такие как рендеринг или конвертация видео.
Особенности карты:
архитектура NVIDIA Turing,
мощный графический процессор,
4 352 CUDA-ядер,
частота до 1 635 МГц,
11 ГБ памяти GDDR6 с шириной шины 352 бит.
Подберите подходящую конфигурацию сервера с GPU по ссылке.
Разработка сервисов, обучение ML-моделей и настройка резервирования — бесспорно важные процессы. Однако в итоге все они упираются в возможности железа. Знаете, как подключить десяток GPU А6000 Ada к материнской плате? Умеете оптимизировать энергопотребление процессора?
Тогда наш новый тест из 10 вопросов о различном оборудовании — для вас! Приглашаем профи блеснуть знаниями, а новичков — узнать что-то новое, ведь в комментариях к вопросам мы оставили полезные материалы.
В калькуляторе компании-разработчика блоков питания для ПК Seasonic появились предварительные данные об энергопотреблении новых видеокарт серии Nvidia GeForce RTX 50.
В калькуляторе появились пять моделей RTX 50:
RTX 5090 — 500 Вт;
RTX 5080 — 350 Вт;
RTX 5070 — 220 Вт;
RTX 5060 — 170 Вт;
RTX 5050 — 100 Вт.
Новые видеокарты серии Nvidia GeForce RTX 50 будут использовать для подачи питания 16-контактный разъём. Ожидается, что первые графические адаптеры серии RTX 50 поступят в продажу до конца текущего года или же в начале 2025 года.
Для сравнения, рекомендованные системные требования по блоку питания с учётом установки ЦП Ryzen 9 5900X: RTX 4090 — 850 Вт (TDP пиковое и стандартное: 650 Вт/450 Вт), RTX 4080 16 ГБ — 750 Вт (TDP 516 Вт/320 Вт), RTX 4080 12 ГБ — 700 Вт (TDP 366 Вт/285 Вт).