Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Надо учесть Call-Convention, благо на x86_64 он один
Применительно к конечному алгоритму я получил ускорение всего-лишь на 15%
Бенчмарки довольно примитивные: генерируем массив псевдо-случайных чисел, потом гоняем по нему 100млн раз каждый метод. Чтобы исключить влияние цикла и прочей обвязки, сначала измеряем время пустого цикла.
Расширенные инструкции процессора в .NET или «C# Intrinsics»