Правильно ли я понимаю, що блок Intel AMX идет один на каждое ядро?
Если этот блок находится отдельно, есть ли возможность одновременно исполнять код на обычных регистрах или AVX/AVX2/AVX512 и на AMX одновременно?
Если результат умножения матриц мне нужен для дальнейше работы, я должен его выгрузить в L1/L2/L3 кеш перед тем как использовать инструкции AVX/AVX2/AVX512?
Есть ли информация про roadmap AMX, я не смог ничего найти про возможные расширения инструкций?
Слышно ли о планах AMD имплементировать его?
Правильно ли я понимаю, що блок Intel AMX идет один на каждое ядро?
Если этот блок находится отдельно, есть ли возможность одновременно исполнять код на обычных регистрах или AVX/AVX2/AVX512 и на AMX одновременно?
Если результат умножения матриц мне нужен для дальнейше работы, я должен его выгрузить в L1/L2/L3 кеш перед тем как использовать инструкции AVX/AVX2/AVX512?