Comments / Profile of Walrus / Habr

How to become an author

Сергей Куксенко @Walrus

User

ProfileArticlesPostsNewsComments169

Java 8 Released

Walrus Mar 19 2014 at 08:36

Ну а зачем я 100500 докладов про лямбды сделал? Вот например
http://jeeconf.com/archive/jeeconf-2013/materials/jdk8-lambda/

Вы пожалуйста не путайте 2 вещи: язык и реализацию. В языке (спецификации) четко и ясно :) сказано «нечто реализуещее требуемый интерфейс». ;) То, что первая реализация от Оракла создает некоторые классы на лету еще ничего не значит. И кстати, это нифига не анонимные классы, ибо термин анонимный класс имеет конкретный смысл прописанный в спеке и не нужно мешать понятия. Кстати, как раз анонимные классы — это синтаксический сахар. ;)

При этом у нас на подходе есть несколько «более других» реализаций. МетодХэндлы, там рожь всякая…
Вот допилим и поменяем. ;)

Java 8 Released

Walrus Mar 19 2014 at 07:04

Сэр, вы не правы.
Это я Вам как разработчик лямбд говорю.

Java 8 Released

Walrus Mar 19 2014 at 06:03

Семантически лямбда — это «нечто реализуещее требуемый интерфейс», никакого анонимного класса.

Поиск причин странной производительности

Walrus Mar 11 2014 at 18:51

ой, где вы такое взяли?

Поиск причин странной производительности

Walrus Mar 11 2014 at 14:35

Нет никакого инкремента IP. :)

Поиск причин странной производительности

Walrus Mar 11 2014 at 14:28

От Интела и взялось. ;)
Кажется где-то до кловертаунов (могу немного ошибаться с микроархитектурой) не было спец обработки NOP и таки он пересылал из eax в eax. Точнее не пересылал, а делал ренайминг, а так как внешний регистр тот же — то ничего не делал. Но в RS попадал и power кушал (перформанс не кушал). Сейчас исчезает уже после декодера.

Поиск причин странной производительности

Walrus Mar 11 2014 at 14:24

«Разве что в машинную инструкцию nop, на которую, в свою очередь, даже процессор не тратит ни такта.»
Ну это если у нас бедный одинокий NOP. :)
А вот если забить NOP-ами весь fetch line (16 bytes), то придется потратится. Немного если fetch line в iCache, и много в противном случае. ;)

PS Да, речь про Intel.

Знаете ли Вы массивы?

Walrus Feb 8 2014 at 12:32

Все проблемы в следующей фразе:
«По этому обращаем его внимание на тот факт, что значения расположены симметрично и просим сэкономить на итерациях циклов. Конечно, зачем пробегать все значения индексов, когда можно пройти только нижний треугольник?»
А дело в том, что экономить нужно не на итерациях, а на операциях. Всё же просто:
— В оригинальном коде у нас N^2 записей в память — и как ты тут не оптимизируй, именно столько и останется. тут не соптимизировать.
— Далее, а стоит ли что нибудь нам i+j? Да ничего оно не стоит. Эта сумма на самом деле индуктивная и заменять такие выражения на инкремент умели еще в 70-х. :) Да к тому же это и пофиг, как i+j так и v+1 вычислаются с латенси в 1 такт, причем на исполнение программы этот 1 такт вообще никак не влияет, пойдет в параллель.
— адресная арифметика? Так же индуктивность + целочисленная арифметика. Intel CPU уже давно содержат по 3 целочисленных сложителя, у AMD тоже не один.
— Обслуживание циклов? Цикл короткий, с вероятностью 99% попадает под LSD (Loop Stream Detector). Profit.

Итого, имеем, что у нас есть N квадрат записей в память. Остальные операции можно не считать. Так что тут оптимизировать? Тут любое прикосновение к коду будет не оптимизацией, а пессимизацией, что автор нам успешно и продемонстрировал.

Вот если бы вместо (i+j) мы считали (int)(sin((double)(i+j))) тогда можно было о чем-нибудь говорить.

Знаете ли Вы массивы?

Walrus Feb 8 2014 at 06:43

> Когда мы последовательно записываем адреса, то вторая запись в границах одной кэш линейки застоллит процессор
совершенно неверно.

Java ME Embedded на Raspberry Pi

Walrus Jan 29 2014 at 08:02

Ага.

Java ME Embedded на Raspberry Pi

Walrus Jan 28 2014 at 21:12

потому и пишу, что не бывает «пишешь и гоняешь»
т.е. бывает, но не всегда, или не так как хотелось или вообще не то ;)

Java ME Embedded на Raspberry Pi

Walrus Jan 28 2014 at 19:20

" Пишешь бенчмарки и гоняешь."
О! Клева, хочу послушать доклад об этом. ;))))

Raspberry PI и JAVA: пристальный взгляд

Walrus Jan 20 2014 at 15:13

устарело

Raspberry PI и JAVA: пристальный взгляд

Walrus Jan 18 2014 at 07:23

Последние версии Oracle Java SE Embedded уже включают в себя и С2.
Так что всё как у больших. ;)

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 16 2014 at 11:01

Если у вас будет частично concurrent gc — то скорее всего вы только mark фазу будете делать конкаррентно с мутаторами, а собственно чистку в стоп-фазу. Тогда опять же мемори барьеры не нужны. ;) Зато полностью и с размаху наступите на false sharing. :) А вот когда вы начнете делать полностью concurrent gc — я уже вам никаких советов давать не смогу за ненадобностью ;)

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 16 2014 at 09:44

Тут есть один нюанс, которые люди часто путают. А именно memory barriers & gc barriers. Еще больше путаницы добавляется когда gc-шные барьеры начинают называть по их специализации, т.е. read-barrier & write-barrier. :)
Так вот — это совершенно разные вещи. Совпадение слова барьер там и там совершенно случайно.
Если у вас не concurrent gc — gc-шные барьеры вам совсем не нужны.

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 16 2014 at 09:40

Тут возникают детали, которых я просто уже не знаю. На самом деле, если Invalidation Queue заполнена — мы очевидно не будем посылать acknowledgement и ожидающее ядро будет стоять и ждать.
Как часто это встречается? Думаю очень редко, ибо я нигде не видел упоминания такой проблемы.

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 15 2014 at 16:29

Нет внятной MM — нет проблем. ;)

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 15 2014 at 10:36

Ты ж сам знаешь всех кто так сделал ;)

А как же всё-таки работает многопоточность? Часть II: memory ordering

Walrus Jan 15 2014 at 10:35

:)

3

4 5 ...