Comments / Profile of netch80 / Habr

Valentin Nechayev @netch80

Программист (backend/сети)

Абсурдно усложнённая схема регистров в Intel 80386

Собственно, поэтому на современных процах с флагами compare+branch обычно фьюзится в одну микроинструкцию, эквивалентную бранчу от MIPS/RISC V.

На моделях уровня от лаптопа или толстого embedded - да, наверняка хотя бы частично сделано.

Это уже не так просто, нужна логика для тракинга зависимостей между инструкциями по отдельным битам

Если таких команд очень мало от общего числа, то логику можно упростить до трекинга полного комплекта флагов. Особенно если не делать, как в старых архитектурах, вредных правил типа "эта команда вон тот флаг не меняет".

ну и операционка должна детектить такое расширение и сохранять/восстанавливать дополнительный регистр, как с векторами

Пишется в полдня с перекурами.

Проще в этих adc/sbc задействовать дополнительный обычный регистр для флага переноса.

Не всегда. Расширить формат команды может быть сложнее и вреднее на будущее, чем иметь служебный регистр. В RISC-V видно по развитию и по заявлениям авторов, как они руками и ногами отбиваются от подобных вариантов, стараясь ужиматься в традиционные трёхадресные форматы. Для fused multiply-add они согласились на 3 входных значения, а для conditional select уже нет - мол, используйте последовательность czero.nez + czero.eqz + or.

Похоже, из за того, что unsigned overflow - UB

Да.

но как тогда этот код на переносимом C/C++ написать

Начиная с C23 есть такое. В C++23 не вошло, но скорее всего будет в 26-м.

До этого переносимого везде варианта не было. Для GCC и Clang были overflow builtins (собственно, возможности C23 это они же), соответственно в Unix мире этим давно пользовались. Хотя напрямую неудобно, лучше через библиотеки. Сложение с ним на godbolt превращается в add + jo, это как раз максимум ужатия.

(Обратите внимание, что у обоих комплектов типы аргументов могут быть все разные. Это полезно для, например, операции сужения диапазона с проверкой. Это неочевидно, я не замечал, пока меня ныне забаненный khim@ не ткнул носом. (Без него тут скучнее.))

Ну и можно было для них же отдельные куски кода компилировать с -fwrapv для реализации такой защиты. Дороже и криво, но работает.