Комментарии / Профиль izard / Хабр

Alexander Komarov@izard

software optimization: CPU, GPU

Хабр Карьера Хабр Эксперты

ПрофильСтатьи23ПостыНовостиКомментарии376

x86 на производстве: high end промышленные контроллеры, Паскаль и вирусы

izard 1 окт 2012 в 12:19

DSP и FPGA серьезно проигрывают и x86 PLC, и обычным PLC в гибкости — стоимости изменения программы.

23 причины не верить в буллшит про работу в больших компаниях

izard 23 авг 2012 в 18:44

5 лет назад и 10 лет назад я мог бы написать похожий пост, и сейчас все еще согласен с автором по всем пунктам. Хотя конечно сильно отстаю по пунктам 15-16.

Хабракамп

izard 31 июл 2012 в 17:44

видел в работе vxworks, различные linux'ы с RT patch'ами и без (если без, то RT код дописывают в ISR от LAPIC или от PCIe устройства), win ce, tenasys intime, патчи к винде от Beckhoff или codesys, bare metal.

Хабракамп

izard 31 июл 2012 в 14:05

hard real time на x86 (core, atom).

Intel Architecture Code Analyzer 2.0.1

izard 19 июл 2012 в 10:39

Так тоже можно, конечно, если бы goto would not be considered harmful :)
Просто в голове по дефолту представляю рекурсивный вид, т.к. последние несколько недель писал на clojure.

Intel Architecture Code Analyzer 2.0.1

izard 19 июл 2012 в 10:26

prepare_setup()
{
//1,2,3
}
profile()
{
//4,5,6,
if (! надоело)
profile();
}

Intel Architecture Code Analyzer 2.0.1

izard 19 июл 2012 в 09:43

обычно не так уж и много вариантов, там же всегда есть зависимости поэтому не все возможные перестановки валидны.

К чему Вы стремитесь в своей IT карьере? (Предположим одинаковый доход всех вариантов)

izard 14 июл 2012 в 13:37

Другое — Консультант. Эксперт в узкой области, связанной с софтом.

Делиться не всегда полезно: оптимизируем работу с кэш-памятью

izard 11 мая 2012 в 10:55

Проблема, которую вы описываете, играет существенную роль для систем с общим LLC, на которых на разных ядрах исполняются RT и GPOS, с или без виртуализации. Если цикл для RT системы порядка сотен микросекунд с толерантностью в десятки микросекунд, вытеснения данных RT процесса из LLC действительно будет критичным.

В ARM есть Cache lock down, которые это решает, в x86 (пока) нет.

Устраиваемся программистом за рубежом

izard 28 апр 2012 в 16:31

+1, В Новой Зеландиии просто не претендовал на дополнительные баллы за диплом для PR, и все равно баллов хватило в свое время (2007 год, как сейчас не знаю)

Устраиваемся программистом за рубежом

izard 28 апр 2012 в 16:28

en.wikipedia.org/wiki/White-tailed_spider
Он конечно из Австралии приехал, но я его в НЗ видел.

Xeon E5: новое поколение серверных процессоров

izard 23 мар 2012 в 10:43

2 копейки:
1. AES-NI уже был в Westmere.
2. Так же в SNB-EP (и вроде в Westmere-EP тоже, но насчет него не уверен) появилась TLB для гигабайтных страниц.

Анонсирована аппаратная поддержка транзакционной памяти в Haswell

izard 13 фев 2012 в 09:19

да, я бы тоже добавил к обычной critical_section optimistic_critical_section с HLE, и чтобы программист или компилятор/рантайм решали, какую выбрать, в зависимости от контеншна, величины, кода внутри.

Анонсирована аппаратная поддержка транзакционной памяти в Haswell

izard 11 фев 2012 в 14:50

1. У меня пока нет железки, так что не мерял. Плюс мы же вроде не имеем права публиковать бенчмарки до выхода железа. По идее если просто перекомпилять с HLE pthreads mutexes, и запустить что-то с большим количеством локов но низким контеншеном на EP или лучше EX будет очень хороший спидап.

2. Да, конечно, в случае сильно многопоточных приложений просто будет лучше скейлится. Но так как цена работы программиста давно уже больше цены процессорного времени, упрощение разработки многопоточного кода тоже хорошая мотивация.

3. Для программиста основная разница в том, что с критической секцией надо постоянно держать в голове, что при взаимодействии с другими локами возможен deadlock, в транзакции нет. Плюс если критическая секция возникла из-за того, что код внутри работает с разделяемой структурой (хэшом, массивом, списком) логично, что оптимистическое выполнение этого кода многими транзакциями одновременно будет часто быстрее, чем обычное сериализованное.

Анонсирована аппаратная поддержка транзакционной памяти в Haswell

izard 10 фев 2012 в 17:29

Я не работаю непосредственно с Microsoft, но уверен, что коллеги, которые работают в штате Вашингтон им сообщили по секрету где-то в прошлом году.

Надеюсь, STM.NET это поможет, и-или F# тоже.

Оформление кода Clojure

izard 4 фев 2012 в 19:40

Eclipse тоже форматирует сам.

Вышло обновление Harmattan 1.2 PR2 для Nokia N950

izard 26 янв 2012 в 20:39

USB host для N9 планируется когда-нибудь?

Об истории реализаций memcpy и их производительности

izard 12 янв 2012 в 22:21

Фреймбуфер — один из сценариев, в котором на Sandy Bridge и последующих процессорах код копирования, реализованный на SSE4 будет существенно быстрее, чем на rep movs.

Вы спросили про бенчмарк, т.к. вы считаете, что мои даные и/или микро бенчмарк некорректны. Я был готов прислать исходник. Где здесь неуважение? Еще пара человек спросили, выслал и им.

Если для виндов не подходит, то для какой ОС? И кстати, что не так с пользователями, которые в числе прочих ОС пользуются и виндами?

Основной тезис моей статьи был, что давно rep movs был эффективным, потом появились гораздо лучшие SSE реализации, но недавно, по сути с Sandy Bridge и последующих, копирование при помощи rep mov, которое используется в ядре Linux и некоторых других продуктов(MSVC stdlib и тд) сравнялось по скорости с сложным SIMD кодом.

Из двух ваших комментариев, если я их правильно понял, следует противоположный тезис — ничего не изменилось, на процессорах Sandy Bridge, которые вышли примерно год назад, SIMD реализация копирования в 20 раз быстрее, чем rep movs.
Я свой бенчмарк (которым, по-вашему, ничего проверить нельзя) описал. Можно узнать подробности вашего? В вашем бенчмарке, где вы копируете картинку для последующего сжатия, у вас просто
memcpu(kartinka_dest, kartinka_src, kartinka_len_in_bytes);
или вы копируете как-то по линиям или еще как-то? Какого размера область памяти? Находится ли она уже в LLC?

-1

Об истории реализаций memcpy и их производительности

izard 11 янв 2012 в 15:01

0. никогда не был силен в оформлении, ну, ты знаешь.
1 да.
2. не поможет, инфа 100%.

-1

Об истории реализаций memcpy и их производительности

izard 11 янв 2012 в 12:14

Сергей, я запостил update.

-1