Как стать автором
Обновить

Комментарии 5

А в чем проблема взять nsight и посмотреть что тормозит? Замерять время рисования это самый примитивный подход чтоб оценить производительность в динамике. Сам замер времени ломает распараллеливание и снижает производительность, а на тайловой архитектуре (TBDR) замеряет некорректно, так как не ломает распараллеливание.

Есть разные иструменты, Unreal Insights и FPSChart были выбраны, потому что мы нашли как их можно интегрировать для автоматизированого сбора данных по производительности, о чем было в первой части.
Я не знаком как работает Nsight в деталях, но судя по тому, что он может выводить туже информацию, что и Unreal Insights, они используют один источник данных. Если у вас есть информация почему Nsight лучше и как его интегрировать для сбора данных, буду рад почитать.

Разница в том, что NSight захватывает последовательность кадров и потом много раз выполняет его чтобы получить точные данные, показывает все счетчики производительности которые есть в ГПУ. Производительность показывает в % от теоретической. Если VRAM используется больше чем кэш - это плохо, если варпы слабо нагружены - тоже плохо, на это можно увеличить производительность в разы. Виртуальные текстуры нагружают шину PCI, надо смотреть чтоб рандер не ждал копирования..

Для Intel CPU есть аналогичный VTune, Где можно посмотреть насколько хорошо оптимизирован код. Но судя по одинаковому времени работы на i5 и i9 то начать лучше с многопоточности.

Могу узнать, как скоро планируется выход следующей статьи? Спасибо.

Конец апреля, май, раньше не успею

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации