@Sivchenko_translate5 дек 2024 в 21:57Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПСВремя на прочтение12 минОхват и читатели1.5KПрограммирование * Высоконагруженные системы * Python * ПроцессорыПереводВсего голосов 11: ↑11 и ↓0+17Добавить в закладки27Комментарии2
@Akorabelnikov7 дек 2024 в 09:19Какие накладные расходы этой абстракции? Нейронки с webgpu у меня запускались в 3-10 медленнее в браузере, чем на хосте
Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС