alizar Apr 6 2017 at 19:05

Специализированный ASIC от Google для машинного обучения в десятки раз быстрее GPU

4 min

23K

Computer hardwareArtificial IntelligenceCPUIT-companies

+21

Comments 24

KiloLeo Apr 6 2017 at 23:00

«Компания не планирует продавать свои процессоры кому-либо» — обидно, однако

Regis Apr 6 2017 at 23:07

Наверняка так будет ровно до тех пор, пока кто-нибудь другой не выйдет на рынок с аналогичным продуктом.
Правда Google, возможно, сможет задушить конкурентов патентами. Без детального анализа трудо сказать наверняка.

aml Apr 7 2017 at 02:26

Мы предлагаем ими воспользоваться как сервисом: https://cloud.google.com/ml-engine/. По задумке, использование сервиса будет дешевле, чем запуск аналогичных моделей на CPU. https://cloud.google.com/speech/ тоже использует TPU.

rotor Apr 7 2017 at 20:11

Там похоже только TensorFlow запустится.

Psychopompe Apr 7 2017 at 21:19

Облака не всегда удобны.

dipspb Apr 8 2017 at 12:53

Да, да… :) И намного дороже чем использование собственного GPU

Equin0x Apr 6 2017 at 23:26

Так биткойны теперь продавать или покупать? )

-2

k0ldbl00d Apr 6 2017 at 23:48

"Специализированный ASIC" — это как "масляное масло". Сама аббревиатура ASIC уже обозначает Application-Specific.

GloooM Apr 7 2017 at 01:45

IT-технологии :)

Meklon Apr 7 2017 at 09:38

Автомобильный завод АвтоВАЗ)

LoadRunner Apr 7 2017 at 10:27

CD\DVD-диск.

tangro Apr 7 2017 at 11:45

Habra-habr

GadPetrovich Apr 7 2017 at 14:35

GNU — GNU's not UNIX.

-1

KiloLeo Apr 7 2017 at 13:30

Протокол TCP/IP

Artystarty Apr 7 2017 at 14:47

CAD design )

zim32 Apr 7 2017 at 00:34

>> до последнего времени, когда внедрила машинное обучение для ряда практических задач, и на эти нейросети начала расти нагрузка с миллиардами запросов от пользователей

А я думал основные мощности во время обучения идут, а потом нет. А тут оказывается от к-ва запросов к обученой сети зависит

aml Apr 7 2017 at 02:21

Обучение действительно очень вычислительно затратное, но оно делается один раз, а запросы к обученной сети — это уже пользовательский трафик, который идёт постоянно и в огромных объёмах.

DustCn Apr 7 2017 at 02:32

>>в то время как в более новой версии Broadwell Xeon E5 v4 количество инструкций на цикл увеличилось на 5% благодаря архитектурным улучшениям, а в версии Skylake Xeon E5 v5, которая ожидается летом количество
инструкций на цикл может увеличиться ещё на 9-10%.

И все? Вот берем Бродвель, сравниваем со Скайлейком и получаем только +10%? Странно что их кто то покупает…

-2

DmitryBabokin Apr 7 2017 at 06:26

Сравнивают плавающее умножение на CPU и GPU с умножением 8 битных целых на TPU. Конечно, в итоге будет сравнение по теплу будет в сто раз. Но что интересно, заявлено что на Haswell пускали также целочисленное 8 битное умножение и оно дало в два раза большие цифры, чем плавающие операции. Что странно, ибо в AVX2 есть инструкции для умножения векторов с 8 битными элементами, что даёт 4 кратное увеличение пропускной способности по сравнению с 32 битным FP умножением, а не двукратное.

Размышления про Skylake тоже странные, ибо в серверной версии будут AVX512 инструкции, которые дадут вдвое большую ширину вектора, чем доступно в Haswell.

Randl Apr 7 2017 at 16:35

Так нет же native 8-битных операций на железе с которым сравнивали

DmitryBabokin Apr 7 2017 at 20:28

Думал можно для это использовать VPMADDUBSW из AVX2, но похоже из-за того, что потом результат нужно вручную ужимать из 16 до 8 бит получается просад производительности.

rPman Apr 7 2017 at 16:55

в статье все цифры сравнения производительности только с процессором, но многократно повторяют что превосходит GPU до 70 раз

GPU по сравнению с CPU дает 10-кратный прирост, без какой либо привязке к архитектуре сети (ограничения только на объем памяти, но она измеряется в гигабайтах, а не 64к страничках)

Я не сомневаюсь что ASIC даст очень большой прирост, но сравнивать нужно все же не с процессором

old_bear Apr 7 2017 at 19:57

По идее, всё то же самое можно сделать на инстансах F1 в амазоновском EC2. Причём кастомного типа, под свою конкретную задачу.
Как знать, может это не сильно хуже по эффективности будет.

sim2q Apr 8 2017 at 23:15

тут все про архитектуру, даже стесняюсь спросить…
Чем жёлтенький тантал от чёрненького на плате отличается?

Show the best of all time