Comments / Profile of uxgen / Habr

Андрей@uxgen

фрилансер (c++, vulkan, оптимизация)

ASUS: игры в 5К слишком тяжелы даже для топовых видеокарт

По спекам видеокарты давно могут рисовать однопиксельные треугольники в 5К 60фпс. Чтение текстур и расчеты тоже дешевые. Но почему-то все тормозит и требует 16гб памяти.

Разбираемся с новой мощной платой Orange Pi 6 Plus на базе Armv9 Cix P1 CD8160

uxgen Dec 23 at 12:46

Только llama не работает с NPU, остается только посчитать TOPS на CPU и GPU.

Но для локального запуска все равно лучше NV на 16гб, стоит не дорого, токенов/с в десятки раз больше, а с помощью разбиения задачи на мелкие куски и небольшой контекст не проблема.

Со старыми играми тоже не очень, где-то с 2010 слишком нагруженные постэффекты которые плохо подходят для тайловой архитектуры. Дешевые АМД на RDNA2-3 в этом случае намного лучше и стабильнее.

В общем железка интересная, но нормального ПО под него нет и не скоро будет.

Инь и ян программирования или alter ego многопоточности

uxgen Dec 21 at 08:46

Какой "такой"

Пока что единствено возможной реализацией алгоритмической медели. Проблема в том, что создатели железа адаптируют его под существующие программы, а программы выбрали путь многопоточности.

Есть еще вариант SIMD/SIMT - когда одна инструкция выполняется для набора данных, такие вот виртуальные потоки с возможностью дешевого чтения регистров соседних потоков, что позволяет наплохо так оптимизировать математику.

Инь и ян программирования или alter ego многопоточности

uxgen Dec 19 at 17:58

Система тасков и корутины уже большой шаг к такой многопоточности. В зависимости от количества потоков выполняющих задачи и будет однопточные или многопоточные программы. Проблема только в устаревших ОС и устаревшей кодовой базе, включая популярные либы.

Анатомия performance-critical C++ кода на примере ECS

uxgen Dec 19 at 11:37

Я больше по графике, но у меня вылезают проблемы, когда CPU выжирает всю пропускную способность общей памяти. Поэтому смотрю как можно оптимизировать эту часть.

Анатомия performance-critical C++ кода на примере ECS

uxgen Dec 18 at 10:56

По использованию SIMD https://gdcvault.com/play/1022248/SIMD-at-Insomniac-Games-How

По оптимизации по L2 идея в том, чтобы загрузить часть данных в L2 и прогнать все системы для них, затем загрузить следующую часть. Аналогично работают тайловые ГПУ на мобилках.

Оптимизации примитивные, проблема продумать архитектуру, чтобы эти оптимизации можно было использовать.

Анатомия performance-critical C++ кода на примере ECS

uxgen Dec 18 at 10:20

Про такие оптимизации расказывали еще на GDC 10 лет назад. Утеряные технологии древних) Сейчас оптимизация по L2 есть в MASS для UE.

А зачем нужно оптимизировать по L2 можно убедиться если нагрузить RAM всего одним потоком и посмотреть как работает встройка. На дешевых интелах у меня получались лаги в 100-200мс на каждый кадр.

Анатомия performance-critical C++ кода на примере ECS

uxgen Dec 17 at 17:27

Не совсем правильно сравнивать производительность с другими либами. По научному нужно считать флопсы и Гб/с. Мой ECS прототип использует L2 кэш и AVX512 за счет этого в 1000 раз быстрее entt.

-2

С появлением ИИ работа опытного программиста стала намного сложнее

uxgen Nov 1 at 17:23

А может идея в том чтобы не писать код по старинке, а обучать небольшие матрицы для перехода между состояниями программы. Тогда проблема закрывается тупыми тестами и тупым машинным перебором.

Я вот вижу как ядер в ЦП становится все больше, скорость работы огромная, а большинство программ все также тормозят и используют один поток, потому что не тянут многопоточку и оптимизации. Теперь появились нейронки, которые можно распараллелить на все нейроядра, больше не нужено писать сложный код, сложную многопоточку, какой-нибудь фреймворк сам распланирует выполнение мелких нейросеток, нужно их только обучить и задать конечные состояния.

-3

Почему даже старые процессоры все еще отлично тянут новые игры в 2025 году

uxgen Sep 19 at 06:18

В новых ЦП более быстрая DDR5 и более широкий PCIE4/5, за счет этого данные быстрее попадают на ГПУ и лоды быстрее подгружаются. Но заметно это только при быстром перемещении.

Куда пойти работать в российский геймдев, если не хочешь создавать «донатные помойки»

uxgen Sep 11 at 06:09

В работе нет творчества. Я как-то устроился в маленькую заграничную компанию, думал что там то точно смогу определять куда движется компания. Но нет, там как и везде все зависит от денег, которые дают инвесторы, они же и решают что мы будет делать.

У нас был план: внедрить автоматизацию тестирования мобильного приложения

uxgen Jul 26 at 11:53

Я делал автоматизацию скриншот тестов рендера на андроид. Сделал отдельное приложение которое скачивает .so, запускает тесты и отдает логи и скриншоты. Может работать даже в фоне, не нужно подключаться по usb.

Как мы разрабатываем отечественный AI-процессор. Часть 2. Секреты GPGPU

uxgen Jun 25 at 11:40

Сейчас даже фильтрацию текстур не нужно поддерживать - придумали стохастическую, читается один пиксель за кадр. Поддержка сжатых форматов не нужна - придумали расжимать на тензорных. Тригонометрия и прочие SFU не нужны - научились считать PBR на тензорах.

Как мы разрабатываем отечественный AI-процессор. Часть 2. Секреты GPGPU

uxgen Jun 25 at 06:53

Учитывая как NV внедряет тензоры в графику так скоро и GPU не понадобится, все на тензорах будет считаться)

Закат инженерной науки и что бы я посоветовал молодым людям, которые мечтают стать инженерами?

uxgen Jun 6 at 04:41

В маленьких ИТ компаниях вывозят за счет хорошей инженерной работы, а не человеко-часов. Только им никто не дает нормальных денег для развития, а если дают, то начинают все контролировать и заводят в высококонкурентную область, где компания закрывается или продается.

Lenovo Legion Go S на SteamOS работает лучше и частота кадров там на 5-15% выше, чем на Windows 11

uxgen May 31 at 04:57

Я заметил что RADV драйвер на линуксе работает быстрее AMDшного. Вот если его портируют на винду, тогда можно будет сравнить влияние ОС.

Корутины в C++20: архитектура и практическое применение

uxgen May 12 at 14:37

Половина статьи про UB и проблемы использования. На самом деле все не так плохо, достаточно полностью переделать архитектуру и корутины заработают без боли и страданий)

Я добавлял корутины поверх уже готовой системы тасков и промисов. Тогда уже использовались правильные примитивы синхронизаций типа зависимостей между тасками, асинхронный мьютекс, что-то похожее на семафор и тд.

Game++. while (!game(over))

uxgen May 9 at 18:25

Когда-то выбрал AngelScript и поначалу все было нормально, но потом вылезли баги в Linux/Android, долго добавляли Mac на arm. В итоге решил что скрипты будут только для ускорения разработки.

По ИИ: смотрел как племянник играет в мобильный файтинг, показывают что подбирают противника равного по уровню, но он выносится с трех ударов. Я сразу сказал что это бот, но не убедил. В общем имитация интеллекта работает для определенной возрастной группы, а тем кто перерос уже скучно играть.

На YouTube-канале Tech YES City появился необычный...

uxgen Apr 26 at 07:14

Тест ни о чем, видно же что частоты ГПУ разные. Надо было выставить фиксированные частоты и потом тестировать.

Увольняешься? Ну и скатертью дорожка…

uxgen Apr 25 at 07:13

Мне заплатили премию спустя полгода после увольнения. Только эта была крипта компании и на момент выплаты стоила $200, спустя пару месяцев уже $0.001. Все что нужно знать про премии криптой)

Хотя на премию битками я год жил пока восстанавливался после травмы)

2 3 ...

7 8