Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

NVIDIA Shield Tablet: субъективный взгляд

Блог компании Кибермаркет Юлмарт Гаджеты Планшеты
NVIDIA Shield Tablet является, определённо, планшетом не для широкой аудитории, но для гиков, игроманов и просто любителей необычных, нетривиальных устройств. Ниже под Хабракатом мы постараемся разобраться, почему и зачем стоит обратить на него внимание, а так же показать, как планшет чувствует себя в полевых условиях, а не в магазинных тестах.


Хотите подробностей?
Всего голосов 25: ↑24 и ↓1 +23
Просмотры 19K
Комментарии 33

История потоковых мультипроцессоров Nvidia

Работа с 3D-графикой *Компьютерное железо Видеокарты Процессоры
Перевод

Последние выходные я потратил на освоение программирования CUDA и SIMT. Это плодотворно проведённое время закончилось почти 700-кратным ускорением моего «рейтрейсера на визитке» [1] — с 101 секунд до 150 мс.

Такой приятный опыт стал хорошим предлогом для дальнейшего изучения темы и эволюции архитектуры Nvidia. Благодаря огромному объёму документации, опубликованному за долгие годы «зелёной» командой, мне удалось вернуться назад во времени и вкратце пройтись по удивительной эволюции её потоковых мультипроцессоров.

В этой статье мы рассмотрим:

Год    Поколение       Серия      Кристалл    Техпроцесс      Самая мощная карта
===========================================================================
2006    Tesla      GeForce 8          G80        90 nm             8800 GTX 
2010    Fermi      GeForce 400      GF100        40 nm              GTX 480
2012    Kepler     GeForce 600      GK104        28 nm              GTX 680
2014    Maxwell    GeForce 900      GM204        28 nm          GTX  980 Ti
2016    Pascal     GeForce 10       GP102        16 nm          GTX 1080 Ti
2018    Turing     GeForce 20       TU102        12 nm          RTX 2080 Ti

Тупик


Вплоть до 2006 года архитектура GPU компании NVidia коррелировала с логическими этапами API рендеринга[2]. GeForce 7900 GTX, управлявшаяся кристаллом G71, состояла из трёх частей, занимавшихся обработкой вершин (8 блоков), генерацией фрагментов (24 блоков), и объединением фрагментов (16 блоков).


Кристалл G71. Обратите внимание на оптимизацию Z-Cull, отбрасывающую фрагмент, не прошедший бы Z-тест.

Эта корреляция заставила проектировщиков угадывать расположение «узких места» конвейера для правильной балансировки каждого из слоёв. С появлением в DirectX 10 ещё одного этапа — геометрического шейдера, инженеры Nvidia столкнулись со сложной задачей балансировки кристалла без знания того, насколько активно будет использоваться этот этап. Настало время для перемен.
Читать дальше →
Всего голосов 26: ↑25 и ↓1 +24
Просмотры 9.7K
Комментарии 3