Comments 18
Хорошо, но мало. Где примеры? Где графики? Тема-то очень интересная.
Курсовая (или дипломная?) неплоха, но вот в качестве статьи не очень пока, увы.
Курсовая (или дипломная?) неплоха, но вот в качестве статьи не очень пока, увы.
Двойная точность на GT630?
По-моему, любой современный 4х ядерный процессор порвет в двойной точности эту карту в разы:-)
По-моему, любой современный 4х ядерный процессор порвет в двойной точности эту карту в разы:-)
Возмущение, конечно, понятно, GT630 для двойной точности не лучший выбор, но думаю не, не порвет, будет просто незначительно лучше, чем CPU. К автору: было бы интересно посмотреть сравнительные графики CPU/GPU или хотя бы комментарий по поводу был ли вообще профит и если да, то какой? или
Время моделирования до оптимизации использования тригонометрических функций составляло 20 минут.относится к коду на CPU?
20 минут относится к коду на GPU.
На CPU считалось на 1 ядре на Java. Т.к. Java медленный, то ускорение на CUDA по сравнению с Java я получал не менее 35 раз.
На CPU считалось на 1 ядре на Java. Т.к. Java медленный, то ускорение на CUDA по сравнению с Java я получал не менее 35 раз.
Тогда все ясно. Вопрос снимается. 1 поток на яве против CUDA :-)
А можете протестировать на мощной карте? gtx titan например? :-)
А можете протестировать на мощной карте? gtx titan например? :-)
возможности нет, к сожалению
Задача из консоли пускается? под linux работает?
только win7, описание ПО вкратце здесь можно скачать статью conferences.neasmo.org.ua/node/2924
По-моему, любой современный 4х ядерный процессор порвет в двойной точности эту карту в разы:-)
Это у вас, наверное, впечатления от 4хх (и более ранних) остались. В 6хх работу с double здорово ускорили. А сравнивать 4(8) параллельных потоков с несколькими тысячами немного смешно.
Вы ошибаетесь, как раз наоборот, в 6хх работу с двойной точностью сильно урезали. Только в титанах (ну и теслах конечно) оставили 1\3 от одинарной, в остальных картах двойных блоков 1\24 от кол-ва одинарный блоков. В 5хх и 4хх сериях коэф. был по-моему 1\8.
Поэтому, например, в двойной точности gtx 570 будет гораздо быстрее gtx670.
Даже последняя GT 630 имеет всего 1-2 SMX, или 192-384 cuda ядер, т.е. всего 8-16 блоков двойной точности на 0.9ГГц.
И таки да, их смешно сравнивать с 4 ядрами на 3 ГГц, умеющих обрабатывать 4-8 double за такт (AVX-AVX2) :-)
Поэтому, например, в двойной точности gtx 570 будет гораздо быстрее gtx670.
Даже последняя GT 630 имеет всего 1-2 SMX, или 192-384 cuda ядер, т.е. всего 8-16 блоков двойной точности на 0.9ГГц.
И таки да, их смешно сравнивать с 4 ядрами на 3 ГГц, умеющих обрабатывать 4-8 double за такт (AVX-AVX2) :-)
А у CUDA есть какие-то преимущества (кроме C ) перед OpenCL?
А можно код? И скриншоты с nvidia cuda profiler.
Sign up to leave a comment.
Пример оптимизации вычислений на CUDA