Кстати, было бы интересно увидеть результаты работы после сборки Intel C++ Compiler"ом - он умеет векторизировать циклы.
SSE инструкции появились девять лет назад, и продолжать их упорно неиспользовать это глупо.
Дело не в лицензии. Профессионалу совершенно пофиг из чего вить веревки - linux или freebsd. Есть люди, которые без проблем красиво решают сложные задачи и на солярке и даже на windows ;-))
А там очень нужна математическая производительность.
Вряд ли они учитывают *размер* кэша. Скорее L2 cache *line size*
Если присмотритесь внимательнее - увидите, что повторяющиеся с виду блоки кода не идентичны.
SSE инструкции появились девять лет назад, и продолжать их упорно неиспользовать это глупо.