Как стать автором
Поиск
Написать публикацию
Обновить

Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС

Время на прочтение12 мин
Количество просмотров2.3K
Всего голосов 12: ↑12 и ↓0+20
Комментарии2

Комментарии 2

Неплохо было бы увидеть сравнение с ONNX WebGPU.

Какие накладные расходы этой абстракции? Нейронки с webgpu у меня запускались в 3-10 медленнее в браузере, чем на хосте

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации