Как стать автором
Поиск
Написать публикацию
Обновить

Процессоры ARM: смешиваем NEON с SVE — и забава, и польза

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров1.9K
Всего голосов 13: ↑13 и ↓0+18
Комментарии4

Комментарии 4

а существует ли сейчас хотя бы одна консумерская железка с sve шире 128 бит?

то, что есть немножко серверов с 256 и 512 (и то емнип до последних просто так не добраться) эт такое.

или как обычно- хотим "avx-1024"- втыкаем нвидию и считаем на ней?

ARM хочет усидеть на двух стулья: энергоэффективность и SIMD. Забавно даже наблюдать за этими потугами :)

А что принципиально невозможного? Если SIMD блоки отключаются флагами, то всегда просто можно выбрать, что Вам нужно. Не считая этого Армы как раз и эффективны потому что у них почти всегда есть деление на энергоэффективные ядра без этих вот наворотов вообще да и еще и с маленьким кэшем, урезаным пайплайном и почти без спекуляций и на производительные для тех кейсов, где либо время критично либо тех, где использование SIMD даст больше FLOPS/W

Настоящая дихотомия это энергоэффективность (много кусков которые работают попеременно каждый эффективно и на низких частотах) vs пиковая производительность (энергоэффективность важна, но фокус на выжимаем каждый флопс производительности из доступного теплопакета). Вот со вторым Армы даже не пытаются.

SIMD как раз и обеспечивает энергоэффективность путём группировки одинаковых операций в широких регистрах.

Только одну команду нужно фетчить, декодировать, переупорядочивать, отслеживать,

а не 4,8, 16 и т.д.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий