Комментарии 11
Что-то как-то они не упоминают про грядущую совместимость х86-винды и ARM. На месте маркетологов я бы кричала на каждом углу, и уж точно в этом анонсе. Неужели с ней не всё так гладко?
На графике у Cortex-A75 производительность выросла, а эффективность не изменилась (по сравнению с A73). Как так?.. Я чего-то недопонял?
Довольно странно, что они говорят про ИИ, машинное обучение и тд, но никаких новых инструкций для работы с матрицами не упоминают, такое впечатление, что это просто чтобы быть в тренде, а по сути они усовершенствовали процессор общего назначения.
Не так давно читал статью про гугловский TPU (сопроцессор для ускорения операций предсказания в нейронных сетях). Они очень сильно упростили вычислительные блоки (они не умеют работать с плавающей точкой и быстро работают только с 8 битными целыми) но там 256х256=64К блоков умножения с накоплением и они умеют работать не с векторами как GPU, а с сразу с матрицами.
Вот таких блочков добавить в процессора было бы интересно.
Не так давно читал статью про гугловский TPU (сопроцессор для ускорения операций предсказания в нейронных сетях). Они очень сильно упростили вычислительные блоки (они не умеют работать с плавающей точкой и быстро работают только с 8 битными целыми) но там 256х256=64К блоков умножения с накоплением и они умеют работать не с векторами как GPU, а с сразу с матрицами.
Вот таких блочков добавить в процессора было бы интересно.
Сложно сказать, по описанию похоже, что по ссылке классический DSP, он RISC и инструкции работают с векторами (одномерными массивами), тут же изюминка в том, что инструкции работают с матрицами (двумерными массивами) но из-за этого пришлось перейти на CISC, т.к. там коэфициенты при умножении сдвигаются «по слоям».
Там вообще много не трендовых упрощений и «шагов назад», которые позволили очень эффективно выполнять конкретную задачу.
Там вообще много не трендовых упрощений и «шагов назад», которые позволили очень эффективно выполнять конкретную задачу.
NeuroMatrix все-таки не DSP, их основное предназначение — как раз нейронные сети.
Гугловская схема — еще более узкоспециализированное решение. И потребление энергии у нее по меркам ARM великовато. Может, со временем и до мобильных устройств с таким сопроцессором дойдет.
Гугловская схема — еще более узкоспециализированное решение. И потребление энергии у нее по меркам ARM великовато. Может, со временем и до мобильных устройств с таким сопроцессором дойдет.
NeuroMatrix действительно задумывался для симуляции НС, но в то время бум НС закончился пшиком, и основным предназначением NeuroMatrix-а стала та самая обработка сигналов. К счастью, на этом поле он оказался вполне пригодным.
А по архитектуре основного вычислительного узла это действительно физическая матрица для умножения с накоплением, много меньше по размерам чем TPU, но зато гораздо гибче, можно скажем, умножить за одну инструкцию матрицу 32х32 2-битных числа на 32х8 8-битных числа.
А по архитектуре основного вычислительного узла это действительно физическая матрица для умножения с накоплением, много меньше по размерам чем TPU, но зато гораздо гибче, можно скажем, умножить за одну инструкцию матрицу 32х32 2-битных числа на 32х8 8-битных числа.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
ARM анонсировала новые процессоры Cortex-A75, A55 и Mali-G72