Bibest Feb 22 at 10:15

Принципы DOD в C++: Часть 1. Оптимизация структур

Easy

7 min

11K

C++ * C * Programming *

From sandbox

+33

Comments 9

NikNikolson Feb 22 at 10:41

Хорошо бы добавить в тест производительности вариант с #pragma pack(1)

tenzink Feb 22 at 11:50

Да, было бы интересно. Подозреваю, что результат будет сильно варьироваться для разных платформ. И скорее всего будет проигрывать подходу с SoA (Structure of Arrays)

Bibest Feb 22 at 11:53

Спасибо! Не слишком пока опытен в тестах, в следующий раз обязательно учту

uxgen Feb 22 at 12:24

pack(1) падает на ARM, если при компиляции не разрешить чтение невыровненых данных, что замедлит весь код

beeruser Feb 22 at 19:48

Может не стоит обобщать? ARM v8 поддерживает невыравненный доступ к данным.

AArch64 provides support for 16, 32, 64 and 128-bit data unaligned accesses.

vanxant Feb 23 at 08:55

Добавлю, что при невыровненном чтении современные процессоры выбрасывают исключение alignment fault. В x86 для совместимости с 8088 есть аппаратный обработчик этого исключения, но его услуги стоят 3-5 тактов, и его можно отключить флагом AF (потому что как правило это указывает на мусор в памяти).

В arm этот обработчик является опциональным: в микроконтроллерах его обычно нет. Кроме того, когда я последний раз смотрел спеку, он не обрабатывал случай, когда данные пересекают границу страницы dram (8k).

В risc-v и sparc его в принципе нет, процессор выбросит af и отправит чинить компилятор

Notevil Feb 24 at 06:38

До 262144 итераций разница во времени минимальна, но на 1000000 итераций она уже составляет 38%!

А то что в таблице результатов все что меньше 1000000 выигрывает BadStruct как-то объясняется или мы просто считаем, что это равный результат, отличающийся не более чем на погрешность измерений?

Bibest Feb 24 at 06:52

В тексте написано объяснение этому явлению:

Массив плохих структур из 10000 и 32768 элементов с размерами спокойно влезает в кэш, 312.5Кб и 1024Кб соответственно.

То есть пока массивы структур влезают в кэш, разница в производительности между BadStruct и GoodStruct находится на уровне погрешности.

Notevil Feb 24 at 07:03

не сказано, что это погрешность. По графику не видно, а в таблице видно, что BadStruct стабильно выигрывает до 1000000.