byman Apr 21 2025 at 10:44

RISC-V: векторное расширение и алгоритм Витерби

Medium

7 min

4.1K

Assembler * C *

+16

Comments 3

unreal_undead2 Apr 21 2025 at 13:11

Порадовало - разница между версиями для произвольной VLEN и конкретно 128 не такая уж большая.

Не порадовало - компилятор сам не сгенерировал RVV код (не далее как в субботу Владимиров убеждал, что масштабируемые расширения вообще и RVV в частности для компилятора удобнее, чем всяческие SSE/AVX).

Salabar Apr 22 2025 at 14:19

На самом деле у авх512 тоже есть экзек маски, так что фича в основном в масштабируемости. И кажется зря они добавили вертикальные операции.

byman Apr 28 2025 at 06:36

Приветствуется подсказка более быстрого решения.

Оказывается подобная проблема существует и обсуждается

Есть лучшее решение, чем в моей статье. Если представить 0х10000=0хFFFF + 1 , то можно обойтись одним умножением с накоплением. __riscv_vwmaccu_vx(__riscv_vwaddu_vv(a, b), -1U, b) Это дает улучшение статистики на 8*120 = 960 тактов.