Комментарии 1
Jetson AGX Orin
Мне вот интересно если там память 256bit LPDDR5 с пропускной способностью 0.2TB/s то как обеспечивается подвод данных? Получается 275/0.2 = 1375 операций с байтом на одно чтение из памяти. А если это сеть то коэффициенты сети в кеш явно не влезут. Куда такая мощь при такой медленной памяти?
ps: для 2048CUDA ядрам с 5.3TFlops получаем 106 операций с float32 на одно чтение из памяти.
достигает 275 трлн операций в секунду275 TOPS на разреженных матрицах | 138 TOPS на плотных матрицах в операциях INT8
Мне вот интересно если там память 256bit LPDDR5 с пропускной способностью 0.2TB/s то как обеспечивается подвод данных? Получается 275/0.2 = 1375 операций с байтом на одно чтение из памяти. А если это сеть то коэффициенты сети в кеш явно не влезут. Куда такая мощь при такой медленной памяти?
ps: для 2048CUDA ядрам с 5.3TFlops получаем 106 операций с float32 на одно чтение из памяти.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Решения для ЦОД, мини-суперкомпьютер: главное с NVIDIA GTC 2022