Sivchenko_translate Dec 5 2024 at 21:57Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПСReading time12 minReach and readers1.6KProgramming * High performance * Python * CPUTranslationTotal votes 11: ↑11 and ↓0+17Add to bookmarks27Comments2
Akorabelnikov Dec 7 2024 at 09:19Какие накладные расходы этой абстракции? Нейронки с webgpu у меня запускались в 3-10 медленнее в браузере, чем на хосте
Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС