на самом деле я слышал что при использовании AVX-512 падает частота процессора, но насколько правда сказать не могу(собственно по этому я использую в основном AVX-256)
но я советую еще использовать на всякий Atomic, через либу stdatomic.h, тогда race condition не будет(если сделать через ring buffering и очереди степени двойки). Но это не относится к вашему вопросу :)
SIMDe это слой совместимости, а не прямой транслятор один в один. То есть если мы вызываем AVX-512 интринсик на архитектуре с SVE, библиотека использует циклы или несколько инструкций SVE, чтобы заполнить требуемый объем данных
подробнее лучше прочитать на официальном GitHub(я закрепил вроде)
я не изобретал а показал принцип, да go популярен из за слайсов(данные лежат очень плотно), быстроты, горутин(потоки на атомарных инструкциях, с малыми плотными буферами)
Да, но к сожалению уже не изменить и никак не оптимизировать только если ничего не делать вообще
И имел ввиду что игнорируется результат а не выполнение), я не спорю что выполнение идёт и транзисторы щёлкают, но смысла для программы нет
Извините, забыл добавить
на самом деле я слышал что при использовании AVX-512 падает частота процессора, но насколько правда сказать не могу(собственно по этому я использую в основном AVX-256)
но я советую еще использовать на всякий Atomic, через либу stdatomic.h, тогда race condition не будет(если сделать через ring buffering и очереди степени двойки). Но это не относится к вашему вопросу :)
SIMDe это слой совместимости, а не прямой транслятор один в один. То есть если мы вызываем AVX-512 интринсик на архитектуре с SVE, библиотека использует циклы или несколько инструкций SVE, чтобы заполнить требуемый объем данных
подробнее лучше прочитать на официальном GitHub(я закрепил вроде)
это avx инструкции а у них размер вектора известен изначально), и еще либа SIMDe помогает компилировать под конкретную архитектуру
Я не про язык говорил...
я не изобретал а показал принцип, да go популярен из за слайсов(данные лежат очень плотно), быстроты, горутин(потоки на атомарных инструкциях, с малыми плотными буферами)
не совсем, это статья про данные и как удобнее читать процессору, а не про конкретный яп
да, спасибо что добавили! Забыл упомянуть
да, но я говорю относительно собственных проектов