All streams
Search
Write a publication
Pull to refresh

Comments 18

Хорошо, но мало. Где примеры? Где графики? Тема-то очень интересная.
Курсовая (или дипломная?) неплоха, но вот в качестве статьи не очень пока, увы.
Добавил связанные материалы внизу статьи «Работы, входящие в одно исследование с данной статьей (добавлено 05.02.2014)».
Детали там, по правилам я не могу их разместить здесь. Однако про проведение оптимизации все равно подробностей недостаточно, но это повод для новой статьи.
Двойная точность на GT630?
По-моему, любой современный 4х ядерный процессор порвет в двойной точности эту карту в разы:-)
Возмущение, конечно, понятно, GT630 для двойной точности не лучший выбор, но думаю не, не порвет, будет просто незначительно лучше, чем CPU. К автору: было бы интересно посмотреть сравнительные графики CPU/GPU или хотя бы комментарий по поводу был ли вообще профит и если да, то какой? или
Время моделирования до оптимизации использования тригонометрических функций составляло 20 минут.
относится к коду на CPU?
20 минут относится к коду на GPU.

На CPU считалось на 1 ядре на Java. Т.к. Java медленный, то ускорение на CUDA по сравнению с Java я получал не менее 35 раз.
Тогда все ясно. Вопрос снимается. 1 поток на яве против CUDA :-)
А можете протестировать на мощной карте? gtx titan например? :-)
возможности нет, к сожалению
Задача из консоли пускается? под linux работает?
Печально, что на win7. Не запустить на нормальных суперкомпьютерах :-)
Останусь при своем мнении, что не так быстра gt630, как медленно работал ява код на CPU.
Эта задача для обычного домашнего пк. Если взять намного больше частиц, то GT 630 не справится, но этого и не требуется.
По-моему, любой современный 4х ядерный процессор порвет в двойной точности эту карту в разы:-)

Это у вас, наверное, впечатления от 4хх (и более ранних) остались. В 6хх работу с double здорово ускорили. А сравнивать 4(8) параллельных потоков с несколькими тысячами немного смешно.
Вы ошибаетесь, как раз наоборот, в 6хх работу с двойной точностью сильно урезали. Только в титанах (ну и теслах конечно) оставили 1\3 от одинарной, в остальных картах двойных блоков 1\24 от кол-ва одинарный блоков. В 5хх и 4хх сериях коэф. был по-моему 1\8.
Поэтому, например, в двойной точности gtx 570 будет гораздо быстрее gtx670.

Даже последняя GT 630 имеет всего 1-2 SMX, или 192-384 cuda ядер, т.е. всего 8-16 блоков двойной точности на 0.9ГГц.
И таки да, их смешно сравнивать с 4 ядрами на 3 ГГц, умеющих обрабатывать 4-8 double за такт (AVX-AVX2) :-)
А у CUDA есть какие-то преимущества (кроме C ) перед OpenCL?
Более популярный пока, лучше оптимизирован под возможности родных карт nvidia ( и то благодаря почти полному забиванию на OpenCL), больше наработок, средств для программеров и т.п.
В остальном минусы.
Всё IMHO.
nvidia cuda profiler не использую. Считаю через JCUDA, и похоже, nvidia cuda profiler не получиться использовать.
Sign up to leave a comment.

Articles