OpenCL даже проще интегрировать, он не требует специальной компиляции и ничем не отличается от обычного C-кода
Но на OCL тяжелее писать код, особенно такой простенький как в приведенном выше примере и уже существующих библиотек под него намного меньше
R + C + CUDA =…