Comments / Profile of redf1sh / Habr

Дмитрий @redf1sh

Аспирант МФТИ. Пишу компилятор для Эльбруса.

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

redf1sh Dec 13 2024 at 21:21

Я не спорю, что путь к LLVM прописан в CMakeLists.txt. Я не понимаю зачем. Вы сами написали, что собираете компилятором g++. LLVM никак не используется в вашем main.cpp. Зачем он тогда?

Вижу, что прописан project(LLVMPassSample) что подсказывает мне CMakeFiles.txt взят от балды из интернета от студенческого репозитория с реализацией своего pass'a.

cmake_minimum_required(VERSION 3.7)
project(LLVMPassSample)

set(CMAKE_CXX_STANDARD 17)

set(LLVM_DIST_PATH "/usr/local/opt/llvm-clang/current"
        CACHE STRING "LLVM distribution install path")

set(LLVM_DIR ${LLVM_DIST_PATH}/lib/cmake/llvm)
find_package(LLVM REQUIRED CONFIG)
message(STATUS "Using LLVM version ${LLVM_PACKAGE_VERSION}")
list(APPEND CMAKE_MODULE_PATH ${LLVM_CMAKE_DIR})

set(LLVM_RUNTIME_OUTPUT_INTDIR ${CMAKE_BINARY_DIR}/${CMAKE_CFG_INTDIR}/bin)
set(LLVM_LIBRARY_OUTPUT_INTDIR ${CMAKE_BINARY_DIR}/${CMAKE_CFG_INTDIR}/lib)
include(HandleLLVMOptions)
include(AddLLVM)
add_compile_options(-march=native)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -O3")

add_definitions(${LLVM_DEFINITIONS})
include_directories(${LLVM_INCLUDE_DIRS})

add_executable(sieve_of_Eratosthenes main.cpp)

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

redf1sh Dec 13 2024 at 18:05

Не увидел у вас ссылки на исходный код. Как мне проверить ваши измерения?

И так, лучшие настройки оптимизации для данного теста на платформах:
x86: Rust - O2, C++ - O3.

Как-то бедно вы смотрели. Откроем список опций в GCC https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html сделаем поиск по "-f" и получим 900+ результатов. Грубо говоря половина будет -fno. Грубая оценка даёт вам 450 опций управления компиляцией. А вы рассмотрели только одну. Также не пробовали режимы компиляции с профилем. Не пробовали опции -march=, которые на Эльбрусе дают большой прирост.

Я не понял какой компилятор вы использовали для Эльбруса.

В сравнении gcc и llc, gcc оказался чуть эффективнее, но разница очень маленькая

Это один и тот же компилятор. LCC является совместимым с GCC по опциям, чтобы облегчить жизнь пользователям по системе сборки. И на Эльбрусах gcc является алиасом lcc в системе. Так что если есть разница, то скорее всего это ошибка измерения.

У меня вызывает вопрос следующее:

C++: GCC v9.3.0 compatible; LLVM version 13.0.1.

Какая версия LLVM у lcc, если его там нет? Или вы тестировали clang? А если нет, то зачем написали?

Ошибка ценой в 50 лет: как Intel потеряла корону в процессорной гонке

redf1sh Nov 5 2024 at 06:33

Можете подробнее раскрыть "изменение потока данных"? Пока звучит так, что ошибка либо в данных (например, изменён порядок полей), либо в программе (она не учитывает какие-то особенности)

Ошибка ценой в 50 лет: как Intel потеряла корону в процессорной гонке

redf1sh Nov 4 2024 at 17:22

Это невозможно технически, так как вы в статике не знаете самые горячие пути исполнения программы (если только вы руками до этого не профилировали и не вставляли подсказки). -fprofile-generate/-fprofile-use даёт вам возможность для заданного тестового набора данных оптимизировать программу лучше. Но нужно держать в голове, что если на train данных у вас будет исполнен один код, а при реальном использовании другой, то вы получите замедление.

Также, в простом режиме -O2 вы собираете программу без LTO оптимизаций. Inline у вас будет работать в пределах одного модуля (если только не вынести всё в headers). Поэтому эффективность будет крайне ограничена.

Поэтому для более быстрого кода старайтесь использовать хотя бы такой набор -O3 -flto (или -fwhole) и сборку с профильной информацией с актуальными train данных.

Также крайне желательно узнать что там с вычислениями с плавающей запятой. -ffast -ffast-math могут тоже сильно ускорить программу.

+11

Ошибка ценой в 50 лет: как Intel потеряла корону в процессорной гонке

redf1sh Nov 4 2024 at 16:17

Как разработчик компилятора для Эльбруса (который тоже VLIW) и которому PGO (Profile Guided Optimizations) дают также прирост производительности могу сказать, что возможно OpenSSL собирал не Intel, а просто обычные программисты, которые никогда не заглядывали в список опций. Даже если открыть список GCC, можно очень долго перебирать те опции, которые есть. Когда опций больше 500, то определить те, которые дают прирост производительности очень сложно. У меня лежит штук 20 научных статей по методам автоматического подбора. А большинство приложений собираются с -O2 и не более.

+45

Официальное заявление разработчика «Байкал Электроникс» Сергея Сёмина по поводу исключения из списка мейнтейнеров Linux

redf1sh Oct 24 2024 at 11:26

Скрытый текст

redf1sh Oct 24 2024 at 10:45

Был бы благодарен, если Вы приведёте ссылку на ветку сюда

Электромобили Volvo и Polestar используют Rust в коде электронного блока управления

redf1sh Oct 8 2024 at 06:50

Третий пункт в тексте прочитал несколько раз. Подумал, что уже совсем с головой не дружу и не вижу взаимосвязи

C++ с точки зрения Rust-разработчика: достоинства и недостатки

redf1sh Sep 21 2024 at 07:24

По тексту ошибок могу добавить, что текст зависит от компилятора. И иногда, чтобы понять о чём идёт речь, легче собрать несколькими компиляторами один модуль. Текст ошибок отличается и где-то в одном случае лучше написано у Clang, где-то у GCC

Qualcomm объявила о решении купить Intel полностью, а не часть подразделений

redf1sh Sep 21 2024 at 07:14

Не дождался похорон легаси с x86s https://habr.com/ru/news/736568/ . А хотелось взглянуть

Почему молодежь не хочет рожать и причём тут система образования

redf1sh Sep 9 2024 at 10:22

Только в институте, когда на первом курсе аспирантуры нам читали курс "История и философия науки" я осознал многие вещи из физики и математики. Но сам этот курс наверно будет не понятен, если не изучил всю теорию, которая упоминается в этом курсе. Такая вот петля, где 2 элемента и оба зависят друг от друга.

Obsidian — Notion свободного человека

redf1sh Aug 28 2024 at 09:49

Я использую Google диск. Для смартфона Drive Sync, для Win10 Google Drive. Вот для Linux нормального приложения я не нашёл, чтобы ещё кеширование нормально работало.

Samsung и Samsung Display вводят 6-дневную 64-часовую рабочую неделю для своих команд

redf1sh Jul 2 2024 at 09:03

Интересная эволюция Южной Кореи в Северную

Как составить функцию инициализации микроконтроллера (Топологическая сортировка графов утилитой Make)

redf1sh Jun 4 2024 at 05:22

А если нужно динамически изменять необходимые в данный момент компоненты прошивки? Не собирать же прошивки со всеми возможными комбинациями.

Российская микроэлектроника — два года спустя

redf1sh Mar 22 2024 at 09:53

Вы можете и сейчас получить доступ к эльбрусам https://t.me/elbrus_gensokyo/3

Релиз LineageOS 21 на основе Android 14

redf1sh Feb 18 2024 at 13:06

Сидел долго и на том, и на том. Могу сказать, что Lineage более плавный, в нем нет кучи мусора (аж 8Гб освободилось, для меня это критично). Но до сих пор не могу стандартное приложение камеры запихнуть в кастомную прошивку. А без него нормально не работают модули (не все распознаются), нет режимов склейки в 100+Мп и тд. Если не пытаться снимать на камеру, как на фотоаппарат, а использовать её для фотографирования счётчиков - то всё замечательно и Lineage (да и вообще любой кастом) будет лучше MIUI

Анонимный Дед Мороз на Хабре: хвастаемся подарками

redf1sh Jan 2 2024 at 16:34

Анонимный дедушка постарался, и подарок приехал прям 31го декабря. Наш питомец тоже захотел распаковать подарочек :)

Computer Science: книги, от новичка до профи

redf1sh Nov 22 2023 at 17:36

То что вы в первый раз про него слышите это ваши персональные проблемы.

Что же так грубо?

широко известны по всему миру, за исключением разве что постсоветских стран (видимо, из-за долгого отсутствия перевода).

Перевод мне и не нужен. Я читал те книги, что привёл в оригинале (в объёме нужном для разработчика компилятора). Возможно, это неплохая книга для вечернего чтива, если совсем не разбираться в устройстве современных процессоров. Но я ни разу не видел, чтобы хоть один серьёзный институтский курс включал её у себя в список рекомендуемой литературы. Ни у нас, ни за рубежом. Книга Харрисов написана не сложнее, а даёт на несколько порядков больше.

Книга, кстати, включает в себя проекты по разработке и компилятора, и виртуальной машины, и ОС. И для вхождения в тему, имхо, подходит на порядок лучше Таненбаума и Харриссов вместе взятых.

Это называется обо всём и ни о чём. Книга указана в разделе "Архитектура компьютера". Зачем в неё запихивать ещё 3 темы? В этой книге уделено всего лишь 24 страницы архитектуре. Она не рассказывает ничего про необходимые программисту вещи. Ни про предсказатель переходов, ни про иерархию памяти, ни про параллелизм (на уровне инструкций, векторные команды, потоки) и тд.

Computer Science: книги, от новичка до профи

redf1sh Nov 18 2023 at 06:41

Если уж начали писать про книги, то упоминайте классику.
Про алгоритмы, если уж для "профи", то почему нет "Алгоритмы построение и анализ" Кормена и Штайна?
Можно сюда же запихнуть "Алгоритмические трюки для программистов" Уоррена
Более специфичные вещи: "Text Algorithms" Maxime Crochemore

По архитектуре компьютера первый раз слышу про Ноам Нисана, но не приведены классические книги: Харрис и Харрис "Цифровая схемотехника и архитектура компьютера, Дэвид М. Харрис" и для мощных ребят "Computer Architecture A Quantitative Approach" за авторством Hennesy и Patterson.

По ОС почему-то нет 4х томника Андерсона "Operation Systems Principles and Practice" и "Операционные системы Внутренняя структура и принципы проектирования" за авторством Столлингса. А про bash и команды Linux stackoverflow расскажет лучше, когда будете решать конкретную задачу.

Почему-то нет книг по компиляторам. Вроде тоже CS. Cooper & Torzon "Engineering a compiler", фиолетовый дракон, "Advanced compiler design and implementation" Steven S. Muchnick, "Modern Compiler Implementation in C" Andrew W. Appel, "Linkers & Loaders" John R. Levine

Виртуальные машины: "Virtual machines" Smith & Nair.

Также в CS входят ещё куча всего, например программирование графики и компьютерное зрение, распределённые системы, базы данных и тд.

Как я писала программу на C#, которая шифрует текст по принципу «Квадрат Полибия»

redf1sh Nov 2 2023 at 13:23

Мне кажется, что если бы вы свою таблицу заменили на хэш-таблицу <key: символ value:набор из 2 цифр>, то сложность вашего решения сразу бы резко упала. Тем более, вы оперируете с заранее известным алфавитом и эту таблицу можно инициализировать статически.

Зачем текст разбивать на слова? Почему просто нельзя итерироваться по массиву символов в один проход?

Свитч, как уже сказали действительно страшный, не ясно зачем он вообще нужен

Ну и статья не совсем для хабра на мой взгляд.

3 4 ...

7 8

Information

Specialization