Pull to refresh

Comments 23

UFO landed and left these words here

Да, китайские доработки слышали. Даже в РФ на Авито есть )

В Москве есть пара контор, перепаивающих желающим их 4090 с 24 на 48Gb - так что то, что это не технические ограничения, а маркетинг - факт.

Не только китайцы, у нас блогер-ремонтник-самоделкин Vikon тоже увеличивает память на 4090 и на некоторых других тоже, вроде за вменяемый ценник.☝️👍🙂

Ничего он не деалает. Просто покупает китайские платы и чипы. А что к чему. всем уже давно все известно.

Нексус даже кино снял как делается и форсил местны паяльщиков
Creating a 48GB NVIDIA RTX 4090 GPU | Brother Zhang's Repair Shop (ft. 张哥)
https://youtu.be/TcRGBeOENLg

а Notebook1 еще два года назад на 3090 память прокачивал
"Видеокарта из мусорки и можно ли 48 гигабайт поставить в ROG Strix RTX3090? Эксперимент за 50000руб."
https://www.youtube.com/watch?v=DbF02Y5yIaQ

Впечатление от статьи такое: искин пытается обосновать, почему ему нужны новые видеокарты с большим количеством видеопамяти.

Ну что есть то есть, действительно память стала узким местом. Например часто производительность 4090 достаточна для задачи, а вот памяти мало. Отсюда и кастомные доработки, как в комментарии выше. Мы, к примеру, уже начинаем переход на 96 GB в среднем сегменте для работы с ИИ )

48 полезно , но штатно на 4090 не получить )

Всмысле штатно& AD102 в консамер картах ничем не отличается от тех что в А серию 5000/5880/6000 тулят, там просто что уставки для чипа разные. Причем в анонсированном, но так и НЕ запущенном в массы 4090TI/24Gb, вобще все установки GPU (Shaders,TMUs,ROPs) одинаковы с A6000/48Gb.

если правильно понимаю, на чипе GeForce 5090 16ть 2канальных контроллеров, то ест 32 чипа GDDR. получается, что даже при чипе в 2ГБ получим 64ГБ.

Контроллеров памяти в GB202 16 штук, они универсальны — поддерживают чипы 16/24/32 Гбит. RTX 5090 технически может работать с чипами памяти 2,3,4 GB. К примеру при 48 ГБ (16×3 ГБ), говорят планировали рефреш в этом году как раз с 48 Gb, но курточка явно не успокоится покв не выдоит публик. По ценам писали, что NVIDIA якобы выбирала 32 ГБ для цены MSRP $1999 vs ~$2400 за 48 ГБ версию. Те $400 за 16 Gb - но даже такой дикой надбавкой они не удовлетворилсь. Лозунг жизни у курточки "Да куда вы все денетесь"

UFO landed and left these words here

Имхо, нечего оправдывать ограничения памяти экономическими и техническими сложностями. Там маржинальность такая, что могли бы любую память сделать. Но принудительная сегментация рынка она такая... Ж — жадность.

Еще и дефицит в наличии ) плюс обычная память RDIMM в серверы +50% к цене уже ) ИИ разгоняет цены и на GPU и на NVMe )

Какит боком AI ускоретили, где HBM память и компы с DDR5 - там не то архитектура чипов и упаковка, литогарфические техпроцессы АБСОЛЮТНО разные. Начнем с того что HBM это вертикально стекированная низкоскоростная SDR память )))

для профессионального видеомонтажа 8K-материала в DaVinci Resolve с применением сложных эффектов и многослойной композиции 24 ГБ видеопамяти часто оказывается недостаточно.

Несколько лет назад на хабре была интересная статья про то, как устроено человеческое зрение. Палочек-колбочек у нас в каждом глазу порядка 100 миллионов (считай, 100 мегапикселей, но... нет), однако далеко не все они используются для построения собственно картинки - многие реагируют просто на освещённость, более того - дальше к мозгу идёт жгут нервов (аксонов), и его "разрешающая способность" - от одного до полутора миллионов линий. То бишь, FullHD человеку более чем достаточно, всё разрешение, что выше, - это всего лишь способ продать то же самое, но - заметно дороже.

Если зажмурится. Поставьте себе моник с FDH, может тоже что какую то разницу заметите)

В области нейросетей карты с 48 ГБ VRAM необходимы для работы с языковыми моделями с большим количеством параметров. Запуск Llama 3.1 (70B) в полной fp16 точности требует около 140 ГБ VRAM. Даже с применением 4-битной квантизации (INT4) для этой модели необходимо около 35–45 ГБ VRAM, что всё равно превышает доступные 32 ГБ на RTX 5090.

Кстати, а какую самую ёмкую модель Llama возможно запустить на М40 с 24 ГБ - пожалуй, самой доступной видеокарте с таким объёмом памяти? И... какой будет скорость её работы? Игра стоит свеч?

на М40 с 24 ГБ - пожалуй, самой доступной видеокарте с таким объёмом памяти? И... какой будет скорость её работы? Игра стоит свеч?

Tesla M40 это древняя карта с очень старой CUDA и медленной памятью (288 Гб/с), без поддержки flash attention и без нормального охлаждения. Среди Tesla имеет смысл смотреть разве что на Tesla v100 32gb.

На данный момент самая доступная карта по объему памяти и цене это AMD Instinct Mi50 32gb. Карточка 2018 года, память очень быстрая (1044 Гб/с), но тоже без нормального охлаждения. Запускать через Vulkan, а не CUDA, поддержка в llama.cpp уже есть.

Но все эти серверные карты это такая категория, где нужно быть готовым к различным нюансам, вроде нерегулируемых вентиляторов и потребления в простое, что не делает их простыми для домашнего использования.

Сейчас есть совсем другой способ запускать тяжелые LLM с нормальной скоростью, хватит обычной десктопной видеокарты, но нужно много RAM, что купить проще, чем много VRAM.

Кстати, а какую самую ёмкую модель Llama возможно запустить

Llama немного устарели, поэтому их запускают только ради бенчмарков. Сейчас в основном всем интересна новая OpenAI GPT-OSS-120B. Её можно запустить на скорости выше 10 t/s на домашнем ПК с обычной видеокартой, и даже на AMD, но нужно 64 Гб ОЗУ.

GPT-OSS-120B на 3 Гб VRAM выдает 24 t/s
GPT-OSS-120B на 3 Гб VRAM выдает 24 t/s

Вот тут подробнее: Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

Llama тоже можно так запустить, относительно свежая и большая Llama-4-Maverick на 402B запускается на 23 t/s.

Llama-4-Maverick выдает 23 t/s
Llama-4-Maverick выдает 23 t/s

Много чего пустить можно поставьте ollama или lmstudio и посмотрите Но чем больше LLM тем она лучше работает ит что бы действитель сравнятся с облачными версиями 48 это минимум. А лучше 92 и выше

В M40 есть куда, старая правда, но нет тензорных ядер и главное нет аппаратной поддержки FP/INT/8/4. Можно был бы что то запустить без квантизации под NVlink с 92+ видеозу, но это будет ОЧЕНЬ медленно почти как на мощных современных CPU. Игра не стоит свечь, а уж розетку все это будет насиловат так и просто немилосердно

Забавные суждения - почему нет карт с 48, потому что они якобы помешают продажам в серверном сегменте. Але гараж, там дело не только в памяти, формфактор, NVlinк, потребление, просто уровень надежности. Тоже самое хоть и менее выражено для рабочих станций. И как раз последний сегмент совсем узкий, куда уже любительского. А еще нет никакого смысла разделять хайэд любительский, который автор зачем то смешал в одну кучу с игровым и рабочие станции. 5090 в играх где основная масса тинейджеры это нонсенс. И с какого перепуга + 33% памяти взвинтит цену ВСЕЙ карты на 50%? GB202-300 чип$450-650 - 32 ГБ GDDR7$550-700 - увеличение объема и цены памяти на 30%, поднимет цену изделия на15%. MATH. Что до GDDR6 то 24Гб - $250, 48Гб ~$500 разница не 300тыс, а всего 30, и это уже после всех ужастей, где тут разы карл! Это называется не сегментация, это называется оббираловка и мозгокрутство. Сиречь большой бизнесс )

Sign up to leave a comment.

Information

Website
mclouds.ru
Registered
Founded
Employees
31–50 employees
Location
Россия
Representative
mClouds_editor