Комментарии 4
а существует ли сейчас хотя бы одна консумерская железка с sve шире 128 бит?
то, что есть немножко серверов с 256 и 512 (и то емнип до последних просто так не добраться) эт такое.
или как обычно- хотим "avx-1024"- втыкаем нвидию и считаем на ней?
ARM хочет усидеть на двух стулья: энергоэффективность и SIMD. Забавно даже наблюдать за этими потугами :)
А что принципиально невозможного? Если SIMD блоки отключаются флагами, то всегда просто можно выбрать, что Вам нужно. Не считая этого Армы как раз и эффективны потому что у них почти всегда есть деление на энергоэффективные ядра без этих вот наворотов вообще да и еще и с маленьким кэшем, урезаным пайплайном и почти без спекуляций и на производительные для тех кейсов, где либо время критично либо тех, где использование SIMD даст больше FLOPS/W
Настоящая дихотомия это энергоэффективность (много кусков которые работают попеременно каждый эффективно и на низких частотах) vs пиковая производительность (энергоэффективность важна, но фокус на выжимаем каждый флопс производительности из доступного теплопакета). Вот со вторым Армы даже не пытаются.
SIMD как раз и обеспечивает энергоэффективность путём группировки одинаковых операций в широких регистрах.
Только одну команду нужно фетчить, декодировать, переупорядочивать, отслеживать,
а не 4,8, 16 и т.д.
Процессоры ARM: смешиваем NEON с SVE — и забава, и польза