nikolai_serdyuk Feb 7 2013 at 06:20

Влияние загрузки шины данных на масштабируемость приложений

6 min

10K

Intel corporate blogConcurrent computing*Programming*

Tutorial

+32

Comments 9

MichaelBorisov Feb 7 2013 at 15:21

Отличное исследование! Благодарность автору.

Akson87 Feb 7 2013 at 16:50

Все достаточно очевидно, но написано хорошо!

akaStiX Feb 7 2013 at 16:52

Мы помним, что процессор обменивается с памятью порциями по 64 байта, которые называются КЭШ-линиями.
Более правильно было бы написать, что процессор обменивается с памятью порциями длинной в кэш линию, которая на современных Intel\AMD процессорах равна 64 байта.
Каг бэ не интелом единым :) на старых процессорах кэш линии были короче, на ARM'ах, на сколько мне известно, на А9\А15 — 32 байта. На консолях с их РРС, тоже, кажется, 32 байта
P.S. На атомах, кажется, тоже 32 байта?!

отокам всё больше требуется КЭШ линий и в силу ограниченности шины им приходится всё дольше и дольше простаивать в ожидании данных.
По сути это кэш мисс — обращение к данным, которых нет в кэше. Было бы неплохо добавить в статью.

Для того, чтобы сделать запись линейной, нужно применить классическую оптимизацию, которая называется «трансформация массива структур в структуру массивов»
На этих словах у всех любителей ООП должен случиться баттхерт, так как такая философия плохо ложится на то, чему мы обычно привыкли

З.Ы. Замечательная статья. Припоминаю только 2 источника, где все было так же толково расписано — книга Касперски по оптимизации и книга от Интел Пресс на ту же тему :) Названия лень гуглить

catlion Feb 8 2013 at 05:14

Видимо, это Code Optimization: Effective Memory Usage и Software Optimization Cookbook: High-Performance Recipes for the Intel Architecture. Обеих, похоже, в электронном виде нет.

akaStiX Feb 8 2013 at 07:24

Да, они. В русском варианте эти обе книги мне обошлись где-то в 150 грн — около 18 долларов. Это копейки за такие книги

mark_ablov Feb 8 2013 at 07:58

> на сколько мне известно, на А9\А15 — 32 байта
Cortex-A15 — 64, а раньше да, были и 32-байтные.
> На консолях с их РРС, тоже, кажется, 32 байта
IBM Cell (PS3) — 128.
> P.S. На атомах, кажется, тоже 32 байта?!
Тоже 64.

> Припоминаю только 2 источника, где все было так же толково расписано
Только Агнер Фог, только хардкор!

Maratyszcza Feb 8 2013 at 08:44

> Cortex-A15 — 64, а раньше да, были и 32-байтные.
Не совсем так: Cortex-A7 и -A8 имеет 64-байтные кэш-линии, а вот -A5 и -A9 — 32-байтные

nikolai_serdyuk Feb 8 2013 at 09:25

Да, это всё сводится к КЭШ миссам. Но акцент в статье сделан на шину данных, так как на архитектурах Out-Of-Order порой бывает очень сложно понять насколько серьезно страдает приложение от какого-либо количества промахов по КЭШ’у. А благодаря замеру загрузки шины это сделать намного легче.

О правильной работе с КЭШом написаны целые книги. Мы конечно же поговорим об этом тоже как-нибудь в другой раз.

akaStiX Feb 8 2013 at 09:36

Мы конечно же поговорим об этом тоже как-нибудь в другой раз.
Тогда позволю себе написать известное выражение — «аффтар, пеши исчо!»