Была популярна идея компиляторов полу-ассемблерных: HLA, SPHINX C–, FlatC, TALx86. Только непонятно зачем они нужны сейчас. По оптимизации и выразительности они проигрывают.
inline asm/intrinsics сам регистры распределяет. Для SIMD это удобно, такого кода больше всего, имхо.
AsmX G4 Raptor: Как мы сделали ассемблер нативным токеном и избавились от боли inline asm