Например, для ускорения сортировки: делим массив на блоки размером в один вей, каждый сортируем (можно параллельно) каким-нибудь квиксортом, потом отсортированные блоки сливаем. При такой организации, каждый элемент массива читается из памяти ровно один раз, и вся последующая работа с ним ведётся через кэш.
Экспериментальное определение характеристик кэш-памяти