Comments / Profile of bircoph / Habr

User

Микропроцессор Эльбрус — потенциальные возможности для развития и применения

bircoph Oct 3 2021 at 20:17

Исходный автор статьи перегибает палку и приукрашивает ОоО, мы это уже обсуждаем в соседних комментариях. Но и Вы, увы, лукавите и перегибаете палку.

Сначала оказалось, что с опцией оптимизации -O2 внутренний цикл компилируется уже в код с 7 тактами на итерацию (вы ещё забыли включить другую рекомендуемую для Эльбруса оптимизацию -ffast).

Ну давайте вместе почитаем документацию к -ffast из man lcc:

       -ffast
           Включает опции  -fstdlib,   -faligned,   -fno-math-errno,   -fno-signed-zeros,   -ffinite-math-only,   -fno-rounding-math,   -fcx-limited-range.
           -fprefetch,  -fmalloc-opt,  -floop-apb-conditional-loads,  -fstrict-aliasing,  -fext-strict-aliasing.

           Данная  опция  выключена  по  умолчанию,  поскольку  включает  преобразования с вещественной арифметикой, которые могут приводить к некорректным
           результатам в случае программ, предполагающих строгое соблюдение стандартов IEEE или ISO для вещественных операций и функций. Тем не менее,  она
           может  существенно  увеличить  скорость  программ,  не  требующих  строго  соблюдения  этих  стандартов.   Кроме  того, опция включает некоторые
           потенциально опасные оптимизации (такие как loop-apb для чтений под условием, malloc-opt, удаление операций целочисленного деления),  которые  в
           определённых случаях могут приводить к некорректному поведению программы.

А заодно и -faligned, взводимого -ffast:

       -faligned (-fno-aligned)
           Разрешить оптимизации, рассчитывающие исключительно на выровненные обращения в память.

           Смысл опции заключается в том, что программист как бы говорит компилятору "я обязуюсь, что в исходнике программы все обращения в память являются
           выровненными на свой формат", в результате чего  компилятор  может  более  эффективно  выполнять  некоторые  оптимизации.  Такими  оптимизациями
           являются:  apb  (аппаратная  подкачка  массивов)  и  arracc  (аппаратная поддержка доступа к массивам) для архитектур до elbrus-v4 включительно,
           автоматическая векторизация (в небольшой степени) и crp_opt (динамический разрыв зависимостей между чтениями и записями в память).

           Необходимость в данной опции вызвана аппаратными особенностями Эльбруса. В архитектурах до  elbrus-v5  включительно  невыровненные  обращения  в
           память  работают  значительно  медленнее выровненных. В архитектурах до elbrus-v4 включительно аппаратная подкачка массивов не умеет работать по
           невыровненным адресам; в elbrus-v5 это ограничение снято для всех операций, кроме 16-байтных; начиная с elbrus-v6 ограничение  снято  полностью.
           Таким образом, для elbrus-v6 и выше опция -faligned имеет смысл только для оптимизации crp_opt.

           Использование  опции  -faligned  при компиляции программы, содержащей невыровненные обращения в память, может привести к некорректному поведению
           программы. Для проверки выровненности обращений в память можно использовать опцию -faligned-check

           По умолчанию для языков C/C++ включен режим -fno-aligned, для Фортрана -faligned

По-моему, совершенно очевидно, что эта -ffast применим лишь в очень узких, специфических случаях; скорее всего, на специализированных числодробилках. А остальной софт будет страдать. Попробуйте собрать с -ffast, скажем, firefox.

рекомендуемую для Эльбруса оптимизацию -ffast

Ввиду выше процитированной официальной документации lcc, Ваше утверждение о рекомендуемости -ffast выглядит как издёвка. Да, это сильная оптимизация, но она ломает код, если не выполняется большое количество ограничений и условия. Так что называть её рекомендуемой — так себе рекомендация. Это полезно учитывать при написании кода под Эльбрус, но мало толку при адаптации уже существующего.