А нужно ли это тысячекратное ускорение в прикладных задачах? Современные процессоры вполне переваривают все эти обвязки, вызванные особеностями высокоуровевых ЯП. А если требуется добиться максимальной скорости в узких местах, тот же .NET позволяет переложить выполнение кода в unsafe-область при помощи CLR, либо же P/Invoke. А там, пожалуйста, и SSE, и AVX-512 и прочие прелести...
А нужно ли это тысячекратное ускорение в прикладных задачах? Современные процессоры вполне переваривают все эти обвязки, вызванные особеностями высокоуровевых ЯП. А если требуется добиться максимальной скорости в узких местах, тот же .NET позволяет переложить выполнение кода в unsafe-область при помощи CLR, либо же P/Invoke. А там, пожалуйста, и SSE, и AVX-512 и прочие прелести...