Unrul18 июн 2018 в 10:46

Особенности вызова функций в С++

33 мин

67K

Assembler * C++ * Ненормальное программирование * Программирование *

+48

Комментарии 29

ilynxy 18 июн 2018 в 14:02

Но чтобы эти данные как-то изменить, их в начале необходимо загрузить в регистры.

Вообще говоря это неверно для архитектуры x86. Есть команды (методы адресации) которые делают RMW или W напрямую с памятью. К примеру INC mem или MOV/ADD mem, imm

Unrul 18 июн 2018 в 14:17

Ага, изменил формулировку. Я имел ввиду, что обычно нельзя изменить данные вообще не используя регистры. Тот же ADD не работает для двух memory операндов.

ilynxy 18 июн 2018 в 14:40

Да я, это, собсно, так, побуквоедствовать.
В доисторической рускоязычной литературе для обозначения регистров часто использовалась аббревиатура СОЗУ (сверхоперативное ЗУ). По сути регистры — это специального вида память, которая адресуется именами регистров (во многих современных архитектурах не мудрствуют и просто называют их r0, r1,… rN). Можно, для накала, рассматривать регистры как кэш управляемый вручную.
На x86 можно написать аналог любой программы, которая использует регистры без использования оных (а вот на load-store архитектуре — не выйдет). Да, ценой быстродействия. Собстно регистровая адресация это всего-лишь способ устранения ботлнека с памятью и ничего более.
Это я к тому, что данные загружаются в регистры не «так или иначе», а для устранения проблем быстродействия связанных с доступом к памяти (как и прозрачные кэши любого уровня).

5oclock 18 июн 2018 в 15:16

А как передаются параметры в функцию с переменным числом аргументов?
Ну или точнее, как она их ожидает получить? Через стек?

ideone.com/uSmc8Y

5oclock 18 июн 2018 в 15:29

Смотрю в main вызовы обеих функций абсолютно идентичны. Что, в общем-то, не удивительно: они вызываются через один и тот же указатель.
Однако функция с переменным числом параметров похоже тоже забирает что-то из регистров.
А что происходит дальше — навскидку пока непонятно.
godbolt.org/g/HkqX5r

Unrul 18 июн 2018 в 16:09

На 20 странице pdf описываются особенности при переменном числе аргументов. Суть в том, что в регистре `al` передаётся число используемых xmm регистров. Остальное то же самое. Внутри метода абсолютно все регистры, в которых могут быть аргументы, копируются на стек, после чего читаются из него по смещению.

Кстати, ` reinterpret_cast(accumulateFunction);` является UB:

The effect of calling a function through a pointer to a function type that is not the same as the type used in the definition of the function is undefined.

Если посмотреть на ассемблер, то видно, что регистр `al` не очищается при вызове через указатель, то приводит, собственно, к UB.

5oclock 18 июн 2018 в 16:13

Интересно, а какой смысл передавать параметры через регистры, а потом кидать их в стек и использовать уже оттуда?

Unrul 18 июн 2018 в 17:06

Иначе не получится в цикле считывать неизвестное количество аргументов. Если они все на стеке, то можно просто читать [rsp, rsp+sizeof(arg)).

5oclock 18 июн 2018 в 17:09

Та функция, которая с фиксированным набором параметров мне кажется то же самое делает.

Unrul 18 июн 2018 в 17:13

Если скомпилировать с оптимизацией (хотя бы -O1), то не делает:

accumulate3Function(int, int, int):
  add edi, esi
  lea eax, [rdi+rdx]
  ret

GCC, кстати, хитрый. Если в функции не вызывается va_arg(args, double);, то он даже не проверяет регистр al.

mayorovp 19 июн 2018 в 07:25

Да, но зачем в такой схеме вообще регистры?

Unrul 19 июн 2018 в 08:56

Судя по всему, когда xmm регистров ещё не было, или в других ABI, va_arg функции были совместимы с обычными. То есть, можно было их вызывать через указатель на обычную функцию, или делать объявления с фиксированным количеством аргументов. Потом появился SSE и это стало UB.

klirichek 18 июн 2018 в 15:58

Вот если бы статья была озаглавлена "особенности вызова функций в clang (или даже llvm)" — я бы понял. А вы тут просто в одну кучу свалили всё — С++, ассемблер (кстати, зачем какие-то левые сайты, есть же директива -S у фронтенда, чтоб сразу получить ассемблер, как в gcc, не? У вас получилась статья на тему llvm abi для архитектуры x86_64. Думаю, к С++ или другому языку она имеет весьма опосредованное отношение (и не удивлюсь, если какой-нибудь скрипт js/lua после jit (если таковой есть через llvm) не будет ничем отличаться).

В целом выглядит эпично, но мне кажется такие вещи было бы гораздо познавательнее выразить через анализ ОТКРЫТЫХ исходников того же clang, чем через reverse-engineering скомпилированного кода (опять же, в свете того, что даже этот шаг можно было бы сразу вывести в формате asm, минуя ненужный дизассемблинг; ещё бы пиратскую IDA тут заюзали для наглядности...). Что подсказывает, что в этих самых исходниках ещё и камменты есть на тему что и почему...

Unrul 18 июн 2018 в 17:04

Да, возможно надо было более явно указать для какой конфигурации проводился обзор. С другой стороны, для других x86_64 компиляторов выводы будут примерно такие же. ABI и стандарт С++ накладывают ограничения.

paluke 19 июн 2018 в 08:03

В windows ABI отличается.

НЛО прилетело и опубликовало эту надпись здесь

Unrul 20 июн 2018 в 15:47

Ага, добавил про gcc. Clang, как я заметил, испытывает некоторые трудности с оптимизацией хитрых манипуляций с регистрами.

mayorovp 19 июн 2018 в 07:31

А где вы тут видите дизассемблинг? Насколько я знаю, используемый автором godbolt.org как раз ключ -S и использует. Кстати, почему вы называете его «левым сайтом»?

klirichek 19 июн 2018 в 10:55

Лично я не знаю, что там использует какой-то сайт (да, честно говоря, и знать это особо незачем, видя результат). И "левый" он как раз по причине, что он тут совершенно лишнее звено. ОСОБЕННО если, как вы говорите, он всего лишь запускает где-то там у себя gcc/clang с ключиком -S.

mayorovp 19 июн 2018 в 11:20

Скажите, а у вас на своем компе есть все версии gcc и clang?

klirichek 19 июн 2018 в 12:02

Все, нужные лично мне для работы. Нынче во время время докеров и быстрого интернета это минутная задача.

mayorovp 19 июн 2018 в 12:07

То есть вы вместо официальных репозиториев используете какие-то левые софтины и непонятное хранилище образов? :-)

klirichek 19 июн 2018 в 12:13

А gcc/clang это уже левые софтины? Ну здрассть…
Сборки под centos/rhel6/7, под long-term debian/ubuntu есть, плюс макось — а остальное неинтересно.

mayorovp 19 июн 2018 в 12:24

Нет, «левой софтиной» я в шутку назвал докер. По крайней мере, два года назад он точно попадал в эту категорию.

НЛО прилетело и опубликовало эту надпись здесь

hdfan2 19 июн 2018 в 04:28

Спасибо за интересную статью, но один момент очень режет глаза. Скажите пожалуйста, в чём смысл делать оглавление и названия разделов на английском? Тут, конечно, большинство его понимает, но от этого возникает ощущение неряшливого перевода, брошенного почти в конце.

Unrul 19 июн 2018 в 06:36

Изначально была идея сохранить терминологию. Хотя сейчас, после множества изменений текста, она уже не особенно актуальна.

saterenko 19 июн 2018 в 07:11

Спасибо за труд, впечатляет, очень полезно.

shakespear 19 июн 2018 в 10:22

Спасибо за статью, полезно посмотреть что и как, у самого руки не так часто доходят:) В дополнение к статье добавлю свеженькое видео от Jason Turner на схожую тему — Negative Cost Structs

Зарегистрируйтесь на Хабре, чтобы оставить комментарий