Pull to refresh
4K+
2
I. Mikhailov@ankro

User

6
Rating
1
Subscribers
Send message

Я попробовал считать нейросетевой слой в конечном поле Галуа GF(137): 4x по памяти, ARM NEON и честные ограничения

Level of difficultyMedium
Reading time6 min
Reach and readers7.3K

Я проверил маленький нейросетевой слой в арифметике GF(137): не через квантизацию готовой float32-модели, а сразу в байтовом конечнополевом представлении. В лучшем замере получилось около 4x по памяти и до 4.86x по времени относительно моей NumPy float32-реализации. Внутри — код нативного ядра, ARM NEON, таблица запусков и честный разбор, где результат не сработал.

Читать далее

Information

Rating
1,081-st
Registered
Activity