Sivchenko_translate Dec 6 2024 at 00:57Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПСReading time12 minViews2KProgramming*High performance*Python*CPUTranslationTotal votes 12: ↑12 and ↓0+20Add to bookmarks26Comments2
Akorabelnikov Dec 7 2024 at 12:19Какие накладные расходы этой абстракции? Нейронки с webgpu у меня запускались в 3-10 медленнее в браузере, чем на хосте
Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС