Comments / Profile of marsianin / Habr

@marsianin

User

ProfileArticlesPostsNewsComments183

Wired: «около дюжины обезьян» пришлось усыпить после вживления чипа Neuralink

marsianin Sep 21 2023 at 16:54

А как этот "комитет" предлагает тестировать подобные вещи, если не на животных?

Look

Made at Intel. Женские истории

marsianin Aug 11 2023 at 15:32

Ну, ради справедливости, ещё не во всём интеле бранчи master переименовали, остались пока ещё адекватные менеджеры.

нужно было найти нового работника - девушку

Я ни в коем случае не оспариваю. Но вроде бы во всех гайдлайнах по найму сказано, что нельзя предъявлять требования к полу и возрасту.

Look

Made at Intel. Женские истории

marsianin Aug 11 2023 at 13:50

Это увлечение diversity заканчивается тем, что главную эйчарку назначают руководить DCAI: https://www.intel.com/content/www/us/en/newsroom/biographies/biography-sandra-l-rivera.html

Look

Об одной мета-оптимизации

marsianin Aug 10 2023 at 13:05

Может иметь значение на тяжёлых enterprise приложениях, когда icache/itlb миссы отъедают значительную часть времени.

Возможно, ошибаюсь, но мне всегда казалось, что icache или itlb miss случится только если переход не предсказался, и при этом branch target далеко относительно инструкции перехода. Всё таки instruction fetch работает спекулятивно. Скорее это будет, на indirect call/jump, и с этим надо бороться девиртуализацией методов.

push/pop - две load/store операции с зависимостью

Если мне память не изменяет, то в том же golden cove сделали memory renaming как раз для такого. Но это только пытается порвать зависимость по данным, store и load всё равно выполняются, травят кэш и греют атмосферу.

Look

Немного об оптимизации кода путем «свертки»

marsianin Aug 9 2023 at 22:08

А теперь давайте считать, сколько обращений в память и арифметики требуют инструкции call и ret, как предсказываются переходы, и какое влияние всё это оказывает на исполнение кода. Нет, серьёзно, в Intel и AMD работают весьма грамотные инженеры, которые к тому же имеют доступ к деталям реализации процессоров. Так что платформоспецифичные оптимизации для x86 никто лучше них не реализует. Достаточно посмотреть, какой код генерируют GCC и llvm, для которых x86-специфичные вещи разработаны инженерами Intel, чтобы отпало всякое желание экспериментировать с 8 и 16-битной арифметикой, выравниванием, уплотнением кода, etc.

Look

Об одной мета-оптимизации

marsianin Aug 9 2023 at 21:22

Только в реальности процессор регистры переименовывает. Все эти rax-r15 в некотором роде виртуальные. В настоящем процессоре будет больше сотни регистров общего назначения. Что касается плотности кода, то больше 32 байт и 5 инструкций за такт всё равно не декодируется, поэтому слишком уж уплотнять тоже нет смысла.

Look

Реализуем с нуля функцию косинуса на языке C

marsianin Jun 19 2023 at 19:46

Почему-то у меня в документе написано другое: "Scalar floating-point SIMD instructions have lower latencies than equivalent x87 instructions. Scalar SIMD floating-point multiply instruction may be pipelined, while x87 multiply instruction is not. Although x87 supports transcendental instructions, software library implementation of transcendental function can be faster in many cases."

Look

Реализуем с нуля функцию косинуса на языке C

marsianin Jun 19 2023 at 15:41

SSE это ещё и скалярные операции. И прочитайте наконец интеловское руководство по оптимизации. Там чёрным по белому написано: не используйте инструкции x87 FPU, они медленные, и сохранены только для совместимости со старым софтом.

Look

Уволить за 60 секунд: что мешает нам увольнять людей вовремя

marsianin Mar 27 2023 at 14:27

А теперь расскажите, как уволить человека, если он не хочет увольняться сам. По сокращению? Проблемно, потом замену не нанять. По несоответствию занимаемой должности? Не оформить. По соглашению сторон? Так он не хочет. Или требует в соглашении каких-то неадекватных выплат.

Look

В условиях параллелизма обнуление памяти замедляется

marsianin Jul 20 2022 at 18:19

IOMMU не пишет в память. Оно только адреса транслирует

Look

Как защищать границы массива без команды BOUND

marsianin Jun 23 2022 at 04:27

Выбросить инструкцию BOUND было очевидно хорошим решением по двум причинам: (1) она реализуется неприлично длинной последовательностью микрокода и (2) компиляторы её не используют.

(1) легко заметить, если посмотреть на семантику. Как минимум, нужно две загрузки из памяти, два сравнения и условная генерация исключения. При этом, пользователь не может никак это оптимизировать, храня границы диапазона в регистрах. Плюс, генерация исключения сама по себе очень дорогая: сброс конвейера и туча обращений в память. Дешевле эту операцию сделать с помощью пары CMP и пары Jcc.

(2) в соответствии со стандартами языков C и C++, на которых пишут большинство критичного к производительности софта, выход за границы массива это неопределённое поведение. Соответственно, компилятор имеет право предполагать, что таких ситуаций в программе никогда не происходит. Следовательно, эти проверки просто не нужны. В частности, и GCC, и clang/llvm их вставляют только если очень хорошо попросить специальной опцией, и при этом часть оптимизаций идёт лесом.

Look

Принцип работы вечного двигателя

marsianin Jun 2 2022 at 21:32

Не получается из дурости извлечь полезную работу, так что увы (-:

Look

Принцип работы вечного двигателя

marsianin Jun 2 2022 at 16:57

Не получается. Квантовая механика не даёт бесконечно уменьшаться )-:

Look

Принцип работы вечного двигателя

marsianin Jun 2 2022 at 16:44

ТС просто описал своими словами вечный двигатель второго рода (-:

Look

Принцип работы вечного двигателя

marsianin Jun 2 2022 at 16:39

Например, 10%, потерянные в нашем агрегате, он возвращает на вход и снова преобразует с той же эффективностью 90% (т.е. 9% от исходного).

Эта "рециркуляция" возможна только с совершением работы, то есть с затратами энергии. Иначе нарушается второе начало термодинамики.

Look

Вычисляем на видеокартах. Технология OpenCL. Часть 1a. Как работает OpenCL

marsianin Sep 29 2021 at 21:50

В общем-то opencl ± жив. И SPIR-V в нём тоже поддерживается.

Look

OMF еще послужит

marsianin Sep 8 2021 at 17:05

Это очень похоже на модули из C++20

Look

OMF еще послужит

marsianin Sep 8 2021 at 12:24

Очевидно, никакие

Look

Зачем нужен регистр SPL

marsianin Aug 28 2021 at 03:41

Более того, архитектура x86 явно запрещает переупорядочивать операции чтения. То есть нельзя поменять местами два чтения или две записи. Можно только чтение и запись.

Look

Зачем нужен регистр SPL

marsianin Aug 27 2021 at 18:09

Всё-таки ABI, а не API

Look

2 3 ...

9 10