На сцену выходил глава Tesla Илон Маск
Во вторник компания nVidia показала новый мощнейший (среди систем с одним графическим процессором) видеоускоритель Titan X с 12 гигабайтами памяти. Розничная стоимость новинки составит от 999 долларов. Также в руках главы nVidia Жэнь-Сунь Хуана появился автомобильный компьютер Drive PX, который призван стать ядром автономных машин.
Новый Titan X показали ещё 4 марта, две недели назад, но то объявление выглядело скомкано и слишком бессодержательно. На тот момент проходила конференция GDC, и во время рассказа представителей Epic Games о своём игровом движке Unreal Engine и его требовательности к «железу» на сцене в качестве особого участника внезапно появился Хуан. Там исполнительный директор nVidia и рассказал о новой видеокарте, не слишком вдаваясь детали.
Конкретные характеристики тогда не разглашались, техническим изданиям, которые могли познакомиться с новой карточкой вплотную, было запрещено распространять какие-либо данные, кроме фотографий. Было сказано, что видеопамяти будет 12 гигабайт, а в чипе 8 миллиардов транзисторов. Лишь две недели спустя на GPU Technology Conference произошло полноценное объявление, на котором прозвучали характеристики и цена нового видеоускорителя, а сразу после этого в сети появились обзоры и тесты Titan X (1, 2, 3, 4, 5).
Titan X уже поступила в продажу. Ядром видеокарты является чип GM200 с 3072 ядрами CUDA, 192 текстурными блоками и 384-битной памятью. Выше изображено упрощённое устройство этой микросхемы. 4 марта на игровой конференции GDC звучала мысль о том, что эта мощь нужна для шлемов виртуальной реальности, а в этот вторник много времени уделялось системам машинного обучения и нейросетям.
Titan X | GTX 980 | Titan Black | R9 290X | |
---|---|---|---|---|
Графический процессор | GM200 | GM204 | GK110 | Hawaii XT |
Ядер GPU | 3072 | 2048 | 2880 | 2816 |
Базовая частота | 1000 МГц | 1126 МГц | 889 МГц | 1000 МГц |
Текстурных блоков | 192 | 128 | 240 | 176 |
Блоков ROP | 96 | 64 | 48 | 64 |
Объём памяти | 12 ГБ | 4 ГБ | 6 ГБ | 4 ГБ |
Частота памяти | 7000 МГц | 7000 МГц | 7000 МГц | 5000 МГц |
Шина памяти | 384-битная | 256-битная | 384-битная | 512-битная |
Пропускная способность памяти | 336 ГБ/с | 224 ГБ/с | 336 ГБ/с | 320 ГБ/с |
Тепловыделение | 250 Вт | 165 Вт | 250 Вт | 290 Вт |
Пиковая производительность, гигафлопс | 6144 | 4612 | 5121 | 5632 |
Количество транзисторов | 8,0 млрд | 5,2 млрд | 7,1 млрд | 6,2 млрд |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм |
Рекомендуемая цена | 999 $ | 549 $ | 999 $ | 359 $ |
Дата запуска | 2015-03-17 | 2014-09-18 | 2014-02-18 | 2013-10-24 |
В Titan X используется та же архитектура Maxwell, что и в GTX 980, GTX 970 и GTX 960. Грубо говоря, по производительности это полторы GTX 980: на 50 % больше ядер, блоков ROP, текстурных блоков, разрядности шины памяти и кэша второго уровня. Во время презентации Хуан также упомянул пиковую производительность в 7 гигафлопс, что отличается от того, что указано выше. Эта производительность достигается на максимально возможной частоте. Предшественники Titan и Titan Black имели производительность с двойными вычислениями в три раза ниже, чем у обычных с одинарной. У Titan X такой особенности нет, и вычисления с двойной точностью в 32 раза медленее — всего лишь 192 гигафлопс.
Кстати, память не поделена на две части, как это случилось с GTX 970. У памяти Titan X нет деления на сегменты, некоторые из которых могут оказаться медленнее других, заверяет nVidia.
Конфигурация чипа GM200 максимальна, в ней стоят 24 модуля SMX, то есть другого более производительного варианта ожидать не стоит. Чип достаточно большой, 8 млрд транзисторов умещаются на площади в примерно 25×25 мм или 625 мм². Для сравнения: у считавшегося крупным GK110 (7,1 млрд транзисторов) площадь достигала 561 мм². Стоковые частоты Titan X незначительно (≈13 %) ниже, чем у GTX 980. Базовая частота равна 1000 МГц, максимальная достигает 1075 МГц, у 980 эти стоковые значения равны 1126 и 1216. nVidia утверждает, что теоретически возможен оверклок до 1,4 ГГц при охлаждении воздухом. Частота памяти та же — 7 ГГц. Самая удивительная характеристика Titan X — это 12 гигабайт видеопамяти, это в три раза больше GTX 980 и в два раза больше GTX Titan Black. В презентации nVidia затронула проблемы игр в 4K, но пока что будет трудно представить игры и конфигурации мониторов, которые потребуют 12 ГБ видеопамяти.
nVidia также говорила о том, как космическая компания Америки номер один SpaceX использует видеоускорители в своей работе. Глава отдела разработок SpaceX Адам Лихтль рассказал, как симуляция сложных физических моделей стала возможной именно на видеокартах. Выполнение этой задачи могло потребовать тысяч обычных процессорных ядер — речь идёт о иоттабайтах (эта приставка означает 1024), которые образуются при анализе моделей возгорания компонентов топлива.
Но без соответствующего софта использовать мощь видеокарт невозможно. nVidia рассказала о DIGITS, это программное обеспечение создания нейросетей для исследователей. Нейросети могут использоваться для обучения распознаванию объектов, но их создание часто вызывает трудности и занимает много времени. Как утверждает nVidia, их продукт может всё изменить. DIGITS доступен для скачивания на странице https://developer.nvidia.com/digits. Ситема обладает интуитивно понятным интерфейсом и поддерживает версию фреймворка Caffe, которая обрабатывается видеокартой.
DIGITS DevBox — это проект самой мощной настольной «молотилки» данных. В компьютер установлено четыре карточки Titan X. При этом вся система остаётся относительно тихой и энергоэффективной. DevBox поставляется с предустановленными программными продуктами, используемыми в исследовательской работе по построению нейросетей: это собственно DIGITS, cuDNN 2.0, Caffe, Theano и Torch. Машинка работает под Ubuntu.
Она очень производительна: обучение AlexNet может занимать лишь 13 часов. Система с одной видеокарточкой потребует больше 2 суток, а на не самом слабом процессоре эта задача займёт более месяца. Стоимость DIGITS DevBox составляет 15 тыс. долларов — это не игровой компьютер для Crysis, а научное оборудование.
Жэнь-Сунь Хуан также обсудил будущую архитектуру Pascal. Она будет базироваться на 16-нм техпроцессе FinFET+ — nVidia пропускает 20 нм. Производительность Pascal на ватт будет в два с лишним раза выше, чем у Maxwell. Другим важным улучшением является использование более производительной памяти, которая называется High Bandwidth Memory. nVidia утверждает, что будет доступно до 32 ГБ памяти на графический процессор, а пропускная способность увеличится в три раза. Таким образом, теоретически возможна пропускная способность до терабайта в секунду.
Карты на основе Pascal впервые будут использовать NVLink, высокоскоростную шину между центральным и графическим процессором или между графическими процессорами. Скорость NVLink значительно выше, чем у PCI Express. Память новой архитектуры будет использовать 3D-технологии, то есть чипы будут иметь и вертикальную ориентацию. В результате всех этих нововведений Pascal может обрабатывать некоторые процессы в 10 раз быстрее. Особое внимание уделяется оптимизациям задач машинного зрения, распознавания изображений, построения и функционирования нейросетей.
Хуан показал Drive PX и назвал его цену. Это компьютер автопилота автомобиля, о котором впервые говорили ещё на CES 2015 в январе этого года. На плате установлены два мобильных чипа Tegra X1 общей производительностью 2,3 терафлопса, которые в состоянии обрабатывать в реальном времени видеопоток с 12 различных HD-камер с использованием 630 млн соединений нейросети. Этот компьютер создаётся для самообучающихся систем ADAS и будущих беспилотных автомобилей.
Drive PX поставляется с упомянутым выше программным обеспечением DIGITS, а также библиотеками захвата и обработки видео. Продукт предназначен как для реальных автопроизводителей, так и исследовательских проектов. Автономные машины — это пока будущее, но компьютер nVidia может его приблизить. Продажи Drive PX начнутся в мае, стоимость платформы составляет 10 тыс. долларов.
Незадолго до объявления Drive PX на сцену приглашали Илона Маска. Он обсуждал вопросы машинного зрения и автономных автомобилей. Хуан подколол Маска: глава Tesla боится искусственного интеллекта, но в то же время считает, что беспилотные автомобили куда безопаснее водителей-людей. Маск объяснил свою позицию: опасность лишь потенциальна, а автономная машина обладает узкой формой ИИ. Маск уверен, что в будущем на необходимость водить свои автомобили мы будем смотреть так же, как сегодня мы воспринимаем бесполезность оператора в лифте. К сожалению, каких-либо слов о сотрудничестве nVidia и Tesla не прозвучало.
По материалам ExtremeTech (1, 2), блога nVidia (1, 2, 3, 4), Re/code, PC Perspective, Techgage, HotHardware (1, 2, 3, 4), ITworld, CNET, AnandTech и The Register.