Comments / Profile of VVS_AMD / Habr

User

ProfileArticles1PostsNewsComments41

Универсальный загрузчик XML на java. Или как загрузить файлы ГАР на 250 гб и остаться при памяти

VVS_AMD Sep 5 at 16:34

Насчёт распараллеливания загрузки XML - это дичь какая-то. Как человек, который реализовал на работе красивый StAX - загрузчик, я с уверенностью могу сказать, что скорость работы таких задач упирается в скорость жёсткого диска (при адекватном исполнении, конечно). Делал как раз для задач, подобных этой. Проц не загружен даже при работе с SSD.
Распараллеливать можно обработку в памяти уже загруженных данных, но никак не саму загрузку/выгрузку.
Тут есть смысл делать в отдельных потоках загрузку и выгрузку. Это даст профит при расположении XML и БД на разных дисках. Обработку (если таковая требуется) можно так же делать в отдельном потоке. Синхронизация через очереди. На Java SE всё это можно делать легко и красиво. И при том, что оба диска будут работать на полную катушку, у ЦП ещё запас будет.

0

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе

VVS_AMD Jun 12 at 16:53

На самом деле очень важно, что за Java там. Если от Унипро, то должна неплохо работать и с минимальным разбросом. А если openjdk портированное, тогда странно, что вообще есть хорошие результаты.

+1

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе

VVS_AMD Jun 12 at 16:49

По сравнению со всеми, кроме C++ и Rust (может и фортран, хз...), да, хорошие результаты. Но когда я специально сравнивал соотношение производительности C++/Rust/Java на x86 и на e2k, то на e2k Java сливает примерно в 2.5 раза. Всё-таки есть куда расти.

0

Реализуем алгоритм поиска в глубину

VVS_AMD Jan 15 at 07:54

На Java, а может и не только, в методе addEdge пропущена строка adjLists[dest].add(src); Без неё не работает. Да как бы и вся идея алгоритма строится на том, что ребра - не векторы. Поэтому можно для начала выбирать любую вершину.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Jan 8 at 10:27

Я в этом тоже не силён. Но, как я понимаю, чтобы использовать LLVM при компиляции C++, нужно компилировать через clang. lcc не использует LLVM. Разница видна не только на Эльбрусах, и на x86 тоже. Только там наоборот Rust сильно вперёд ушёл. Но это под Линуксом!
Попробовал под Виндой компилировать. Там для Rust сишный компилятор вроде используется и результат получается уже ближе к сишному (Rust под Виндой медленнее, чем под Линуксом).
Пробовал под Линуксом собрать для Винды бинарник (кросс-компиляция). Бинарник собрался, но при запуске возникли проблемы. Толи библиотеки не хватало, не помню. Не стал в эту тему дальше закапываться.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Jan 8 at 10:15

На самом деле отставание может сократиться, когда будет доступен режим PGO для Rust. Для плюсов режим PGO дал шикарный профит, сопоставимый с опцией -ffast-math. Жду обновы ОС до 8.2 на тестовой машине. Может и GO добавлю, если будут адекватные результаты. Реализация на GO есть, но результаты на e2k сейчас совсем неприличные.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 24 2024 at 18:33

Это yukari. Т.е. просадки проявляются, если над многопоточным приложением трудятся ядра с разных ЦП?
В общем то, я подозревал, что при использовании нескольких ЦП могут быть просадки. Хотя для тестов одного ЦП в многопотоке эта проблема решается довольно просто. Особенно если нет задачи брать все 8 ядер, а ограничиться, например, четырьмя. Но здесь у меня тут не стояла задача тестить производительность всего проца. Акцент именно на компиляторах. На одном ядре точнее выходит.

0

Система o3 от OpenAI достигла уровня человека в тесте на общий интеллект. Что это значит?

VVS_AMD Dec 24 2024 at 15:34

Если все задачи аналогичны той, что на примере, то тест ни разу не сложный.

0

Система o3 от OpenAI достигла уровня человека в тесте на общий интеллект. Что это значит?

VVS_AMD Dec 24 2024 at 15:30

Лучше бы пенсионерам раздали?

+10

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 23 2024 at 13:45

Для Эльбруса используется lcc. В разделе "Софт" так и указал:

Elbrus Linux 7.2

Java: OpenJDK Runtime Environment (build 11.0.15-Unipro+0-adhoc.root.openjdk11-11.0.15).

Rust: rustc / cargo v.1.57.0.

C++: lcc:1.26.22:Jan-10-2024:e2k-v4-linux (gcc (GCC) 9.3.0 compatible)

Испытуемые: Java, Rust, C++(GCC, LСC).

+1

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 19 2024 at 15:25

Сделал по отдельной ветке для тестов. Добавил туда исполняемые файлы и ассемблер.

+1

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 18 2024 at 14:41

DCMAKE_CXX_COMPILER=clang++ -DCMAKE_C_COMPILER=clang. Выше я привёл как это сделать.

Да, спасибо. Позже, если буду дальше закапываться в C++, подойду к компиляции более серьёзно.

Компиляция в режиме -fprofile-generate, запуск программы на данных в 5*10^8,

Я конечно понимаю, что в данной программе скорее всего диапазоны: 0-100М, 0-500М, 0-1000М... дадут одну и ту же статистику. Но сам подход подстановки исключительно данных теста для сбора статистики больше похож на читерство. Нужно же, чтобы после профилирования программа получила бонус на произвольном диапазоне. Я поставлял последовательно: 100М, 500М, 2000М. Процесс подробно описал в разделе "Описание опций тестирования". Профит гарантирован.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 17 2024 at 14:13

... см. "Описание опций тестирования"

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 17 2024 at 11:49

О, спасибо! Поправлю статью с учётом этих данных.

cmake -- это не компилятор.

Да я знаю. Я имел ввиду команду, которой запускаю компиляцию. Подразумевая, что настройки компиляции следует читать в CMakeLists.txt.

Вы могли сами это проверить, но давайте я сделаю это за вас:

Честно говоря, в представленном ниже выводе мне и сейчас не очевидно, что LLVM не работает. =)

-- Using LLVM version 9.0.1

...подключен же. Но, видимо, использование LLVM должно выглядеть по другому.

PGO тут не помогло.

Кстати, получил результат C++ O3+PGO - 2447мс (без прочих -ffast -ffast-math). Пока не опубликовал, т.к. буксует компиляция Rust+PGO.
Не знаю, как вы делали двухфазную компиляцию, но у меня профит хороший получился. В статье укажу подробно как делал.
С вашими рекомендациями: long int, #pragma swp; -O4 -march=elbrus-v4 -ffast -ffast-math -fforce-loop-apb -fforce-vect -fforce-swp PGO даёт результат 1970мс. (при 1200Мгц), что при пересчёте на 1300Мгц даст 1818мс.
Не хотел обновлять статью с результатом PGO, пока нет аналогичного на Rust. Но на Rust двухфазная компиляция недоступна по независящим от меня причинам и на неопределённое время. Так что выложу пока как есть.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 15 2024 at 15:23

Я уже не знаю как ответить, честно. Тему статьи пробовали читать?

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 14 2024 at 15:05

Внимание! Мы тестим однопоток! Это раз.
Целерон тоже можно засунуть в четырёхпроцессорный сервер и получить в итоге 32 ядра? Он поддерживает ECC память? Статья не про "выбор самого выгодного ЦП на 2015 год". Это два.
Ядрён, батон, какая цена?

Эльбрус можно и с лампочкой сравнить, если речь пойдёт о содержании драг.металлов в электронных компонентах. Главное - оставаться в теме.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 14 2024 at 15:01

Жаль, что нет образца потестить. Самое крутое, что есть в общем доступе, это E8C.

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 14 2024 at 11:15

Я, как бы, имел ввиду в общем...
Ну а в этой задаче, почему линейно частоте? У 2C3 пиковая производительность в два раза больше операций за такт. Вы смотрели исходники теста? По моему, самая затратная функция makeHoles() отлично разложится в широкую команду любой длины. Там блоки по 10000!

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 14 2024 at 10:12

Я же написал, ко компилировал двумя способами: g++ и cmake. И про мизерную разницу между компиляторами... как раз про это.

CMakeFiles.txt взят от балды из интернета

Не от балды, а как результат поиска вариантов использования LLVM в cmake. На статус спеца по C++ не претендую. И в статье об этом написал. У меня, как у java-разработчика с минимальными знаниями C++ и Rust, написав годный код на этих языках, стояла задача собрать годный исполняемый файл с применением самых профитных оптимизаций. Единственной ошибкой в этом вопросе пока неиспользование PGO. Исправляю этот момент.
Огромная просьба! Прочитайте внимательнее статью и мои комментарии. А то вы уже начинаете с меня спрашивать то, чего я не писал...
Даже тут:

В сравнении gcc и llc, gcc оказался чуть эффективнее, но разница очень маленькая

Это один и тот же компилятор. LCC является совместимым с GCC по опциям, чтобы облегчить жизнь пользователям по системе сборки. И на Эльбрусах gcc является алиасом lcc в системе.

У меня написано про llc - LLVM static compiler. А вы мне про LCC...

0

Сравнение эффективности компиляторов под Эльбрус на примере решета Эратосфена

VVS_AMD Dec 13 2024 at 20:01

Благодарю. Поправил.

0

1