Comments / Profile of X

User

X_OSL Sep 7 2015 at 04:18

Пожалуйста, выложите хотя бы исходники этого сравнения, очень интересно посмотреть как именно реализованы C++ и С# варианты.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 23:05

Я предложил вариант их оценки (вернее и задолго до меня такие варианты были предложены)

Какой вариант предложили бы вы?

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 23:03

Опять таки, приведите примеры тестов, которые бы учитывали неэффективную работы с памятью, думаю всем будет интересно почитать статью про это.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:59

Думаю общие принципы генерации managed кода в тестах схожи с вашим случаем. Думаю что принципы применяются схожим образом для разных типов. Хотя конечно в каждом случае могут быть свои нюансы.
Но управление кодом вряд-ли может быть бесплатным.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:51

Было бы интересно, если бы вы привели пример такого теста, мы бы сравнили результаты выполнения managed и unmanaged реализации и сделали бы выводы.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:48

Я же все это описал. Нужно просто знать сколько времeни занимает ваш код в runtime.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:46

Различные тесты(не только мои) подтверждают примерно такую разницу.

По скольку тестов опровергающих данную разницу нет, считаю оправданным ее использование.

И разумеется восьмикратный разброс вполне объясним т.к. зависит от задачи.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:42

Все-таки, при правильном получении disassembly и использовании unsafe\fixed код получился такой для items[j] = items[i];

items[j] = items[i];
000000a1 mov ebx,dword ptr [ebp-38h]
000000a4 mov esi,dword ptr [ebp-38h]
000000a7 mov eax,dword ptr [esi+edi*4]
000000aa mov dword ptr [ebx+ecx*4],eax

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:33

Да, но тут тест крайне простой, инлайнить вроде бы и нечего…

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:30

Именно поэтому внизу привел результаты тестирования для VS2015:
«Не вдаваясь в детали: самая быстрая сортировка для C++ заняла 153105, а самая быстрая для C# 206552.
То есть разница порядка 30%»

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:29

Промасштабировал 10-80%, полученные в моих, и не только моих тестах.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:28

Тоже самое получается. NGen же влияет только на время запуска ассембли\функции, а весь тест находится в теле одной функции, поэтому к моменту ее запуска уже является скомпилированным.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:26

Тогда можно предположить, что использование managed кода даст дополнительные потери производительности в диапазоне 5-40%, и если загрузка CPU лишь 40%, то порядка 40% от этого диапазона, то есть ориентировочные потери будут лишь 2-16%
(если правда 40% загрузка)

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:13

Тесты измеряют лишь скорость выполнения «вашего» кода.

Сколько же времени придется на «ваш» код, а сколько на код системы вы должны определить профайлером или же вывести из собственного опыта в реализации или профилировании подобных задач.

Масштабировать результаты возможно, используя соотношение между временем выполнения вашего кода и кода системы. Соотношение нужно знать априорно, из опыта разработки.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 22:01

Конкретная цифра будет разной в каждой конкретной задаче. Вы должны знать сколько процентов runtime приходится на ваш сервис, например померив этот процент профайлером и далее делать выводы о необходимости оптимизации.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 21:59

Обновление: дело было в неправильном получении disassembly.
На самом деле и в случае VS2010 оптимизация вполне приличная, но все-таки несколько хуже чем в случае с С++.

Тесты на 2015 студии показали разницу порядка 30% на платформе Core i7-3770

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 21:56

А какую оценку оценку производительности или методику, которую можно экстраполировать на сложные случаи по вашему мнению?

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 21:54

Я даже специально раздел в статье написал «Какая же все-таки реальная оценка?», где указал на это соотношение в реальных задачах.

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 21:49

Именно поэтому актуализирую результаты:

Собрал тесты под VS2015 и запустил.
Не вдаваясь в детали: самая быстрая сортировка для C++ заняла 153105, а самая быстрая для C# 206552.

То есть разница порядка 30%

Look

Сравнение производительности С++ и C#

X_OSL Sep 6 2015 at 21:40

Обновил код в статье и комментарий к нему.

Кстати, если использовать items.Length, то код по крайней мере для случая VS2010 получается примерно такой-же.

int tmp;
for (int i = 0; i < items.Length; i++)
0000007d xor ebx,ebx
0000007f mov eax,dword ptr [esi+4]
00000082 mov dword ptr [ebp-44h],eax
00000085 test eax,eax
00000087 jle 000000C3
for (int j = i; j < items.Length; j++)
00000089 mov edi,ebx
0000008b cmp dword ptr [ebp-44h],ebx
0000008e jle 000000BD
00000090 mov eax,dword ptr [esi+4]
00000093 mov dword ptr [ebp-48h],eax
{
if (items[i] < items[j])
00000096 mov edx,dword ptr [esi+ebx*4+8]
0000009a mov eax,dword ptr [ebp-48h]
0000009d cmp edi,eax
0000009f jae 000001BE
000000a5 mov ecx,dword ptr [esi+edi*4+8]
000000a9 cmp edx,ecx
000000ab jge 000000B5
000000ad mov dword ptr [esi+edi*4+8],edx
items[i] = tmp;
000000b1 mov dword ptr [esi+ebx*4+8],ecx
for (int j = i; j < items.Length; j++)
000000b5 add edi,1
000000b8 cmp dword ptr [ebp-44h],edi
000000bb jg 00000096
for (int i = 0; i < items.Length; i++)
000000bd inc ebx
000000be cmp dword ptr [ebp-44h],ebx
000000c1 jg 00000089
}
}

Look

1 2

4 5 ...

13 14