Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
точечное произведениену серьезно, даже Google Translate переводит «dot product» правильно.
У него 8-битные регистры с плавающей запятой«8-wide» там означает 8 значений по 32bit float.
1) Вроде как на последних Core оверхед сведен к минимуму

Не случается ли проседания производительности при переключении между avx2 инструкциями и обычными?
При компилировании в AVX-таргет, SSE-инструкции тоже генерируются в схеме кодирования инструкций VEX, что позволяет выполнять без пенальти.
The AVX instructions support both 128-bit and 256-bit SIMD. The 128-bit versions can be useful to improve old code without needing to widen the vectorization, and avoid the penalty of going from SSE to AVX
Разновидности SIMD