Alexander Komarov @izard
software optimization
Русская микроэлектроника и украинский IoT на конференциях SVOD и IoT DevCon в Силикон Вэлли
izard
для ЖЖ может нормально. А на хабре обычно одна статья — одна тема.
0
LookРусская микроэлектроника и украинский IoT на конференциях SVOD и IoT DevCon в Силикон Вэлли
izard
Юрий, отличный пост! Но уж очень разные темы подняты, и их слишком много для нормального восприятия как цельной статьи. Например, та часть, что о беседах с «техно-феминистками», очень хороша; мог бы получиться отличный отдельный пост об особенностях карьеры.
0
LookCAT — Управление размером кэша процессора
izard
А, тогда ладно. Но бранч предикт, кэширование, simd и gpu принципиально на arm не отличается. Так что вся эта гонка за % CPI за счет небольшой оптимизации текущих боттлнеков в конвейере продолжается надолго. Есть конечно и технологии 90х а не 70х, но про них, когда/если придет время, расскажет большой босс на IDF.
+1
LookCAT — Управление размером кэша процессора
izard
Архитектурные энергозатраты? Вы имеете в виду декодер x86 инструкций во фронтенде? Посмотрите на кристалл даже не Xeon, а Атом, и найдите сколько он по площади занимает. Лет 15 назад это еще был какой-то ощутимый %, а теперь — сотые доли % если не тысячные.
0
LookCAT — Управление размером кэша процессора
izard
А зачем это Интел? Несколько лет назад появились серверные Арм, и одновременно появились сервера на Атом с соответствующим энергопотреблением.
+4
LookЛаборатория роботехники и девушки в Сколково
izard
Там серферы есть, значит есть где недорого взять напрокат wetsuit, и купаешься сколько влезет.
0
LookСамая медленная инструкция x86
izard
Если с splitlock как в примере, то несущественная. Если без сплитлока, надо измерять, не знаю так.
0
LookСамая медленная инструкция x86
izard
AVX и SSE содержат достаточно простые инструкции. Скорее всего, если на них написать свой логарифм, может быть быстрее.
0
LookСамая медленная инструкция x86
izard
Только чтобы подключить старое железо — старше broadwell и skylake, или редкое/мелкое. Весь зоопарк постоянно держать подключеным места не хватает, да и зачем — очень редко нужно.
0
LookПроверяем открытый исходный код UEFI для Intel Galileo при помощи PVS-Studio
izard
Спасибо, перешлю ссылку на google translate статьи человеку, который должен знать разработчиков quark EDK2
+2
LookСамая медленная инструкция x86
izard
Да, выше уже написали, что еще это может быть особенно дорого на Xeon-EX, там NUMA особенно злая.
0
LookСамая медленная инструкция x86
izard
Можно, даже если другие VM работают на других ядрах. Но для многопроцессорного сервера — только соседей по процессору. VM можно запрограмировать это ловить и давать таким гостям совсем мало тактов, но вроде это нигде пока не реализовано.
0
LookСамая медленная инструкция x86
izard
А, это от vtune осталось, иначе ивенты не ловились. Конечно можно один раз померить, будет несколько тысяч циклов. Спасибо, поправлю.
+2
LookСамая медленная инструкция x86
izard
да, я что-то код сверху не могу заставить тормозить, исполняю как раз на HSW. Схожу в лабу на SNB проверю, как раз выдран с реального кода на SNB.
+1
LookСамая медленная инструкция x86
izard
WBINV надо быть в ring 0, ее неожиданно в пользовательском коде оказаться не может. Кстати, она сама не очень медленная, тормоза начинаются потом, когда оказывается что кэш пустой.
+2
LookСамая медленная инструкция x86
izard
В Atom еще почти независимое. Но даже там в этом микрокоде полно load/store, которые занимают обычные порты. а в HSW core просто 8 портов, некоторые содержат в том числе execution units, работающие с fp.
+2
LookСамая медленная инструкция x86
izard
Эта инструкция декодируется в длинный микрокод, так что нет (то есть этот микрокод, понятно, ипользует ILP внутри себя, но следующие инструкции ждут).
+3
LookСамая медленная инструкция x86
izard
Да, десятки и сотни, все примеры из статьи кроме fy2x — тысячи.
0
LookСамая медленная инструкция x86
izard
Сейчас проверю последний раз этот пример я запускал 2 года назад. Наверное, -fast-math включился, он отбрасывает denormals. Но код вроде правильный сгенерился.
+3
LookПрактикум «Intel IoT». Edison — могучая «кроха»
izard
Для wifi/bluetooth на галилео оч. рекомендую minip-pcie типа Intel N135 или 6250
+1
LookHereThere
12
345 ...
1718
Information
- Rating
- Does not participate
- Location
- München, Bayern, Германия
- Date of birth
- Registered
- Activity