Sivchenko_translate 5 дек 2024 в 21:57Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПСВремя на прочтение12 минКоличество просмотров2.3KПрограммирование * Высоконагруженные системы * Python * ПроцессорыПереводВсего голосов 12: ↑12 и ↓0+20Добавить в закладки26Комментарии2
Akorabelnikov 7 дек 2024 в 09:19Какие накладные расходы этой абстракции? Нейронки с webgpu у меня запускались в 3-10 медленнее в браузере, чем на хосте
Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС