Так написано же, что на double производительность в 10 раз падает. Смотрите float:
Blas — 87, Cuda — 372. В 4.3 раза быстрее чем Quad, в 17 раз быстрее одного ядра.
Думаю, быстрое преобразование фурье может дать больший разрыв во floate за счёт хорошего синуса в Nvidia.
Там трасса проходила как бы по верхушке высокой стены. С огромными перепадами высоты и крутыми поворотами, с длинными прыжками и возможностью вылететь.
Работа с изображениями — классический пример. Фильтры, декодирование raw и т.п.
Видео-обработка тоже должна хорошо лечь на GPU, особенно в HD-варианте.
CUDA-архиваторы не за горами.
Это я всё про ширпотреб. А что уж говорить про узкоспециализированные числодробильные приложения, в которых перемножение матриц из миллионов элементов — обычное дело!
Для работы с тестом подходит хорошо, а для разных сортировок массивов змейками — не уверне, не знаю
Всякие сортировки и т.п. переводятся между Паскалем — Си — Perl — Ruby и подобными процедурными языками механически и бездумно. А скорость работы при обучении не важна.
Total Physical Source Lines of Code (SLOC) = 6,399,191
Schedule Estimate, Years (Months) = 9.59 (115.10)
Estimated Average Number of Developers (Effort/Schedule) = 206.81
Total Estimated Cost to Develop = $ 267,961,839 (average salary = $56,286/year, overhead = 2.40).
Blas — 87, Cuda — 372. В 4.3 раза быстрее чем Quad, в 17 раз быстрее одного ядра.
Думаю, быстрое преобразование фурье может дать больший разрыв во floate за счёт хорошего синуса в Nvidia.
Видео-обработка тоже должна хорошо лечь на GPU, особенно в HD-варианте.
CUDA-архиваторы не за горами.
Это я всё про ширпотреб. А что уж говорить про узкоспециализированные числодробильные приложения, в которых перемножение матриц из миллионов элементов — обычное дело!
Всякие сортировки и т.п. переводятся между Паскалем — Си — Perl — Ruby и подобными процедурными языками механически и бездумно. А скорость работы при обучении не важна.
Вот хорошо видно: www.timestretch.com/FractalBenchmark.html
А даже хорошие клавиатурщики проигрывают джойстику/рулю более минуты :-)
Но из NFSных серий самая лучшая, наверное, NFS:PU. Пусть только Porsche, но зато какие разные! Дальше всё аркаднее и аркаднее становилось.
Как мониторите среднее время выполнения запроса и сколько запросов в секунду обрабатываете на ядро?
Total Physical Source Lines of Code (SLOC) = 6,399,191
Schedule Estimate, Years (Months) = 9.59 (115.10)
Estimated Average Number of Developers (Effort/Schedule) = 206.81
Total Estimated Cost to Develop = $ 267,961,839 (average salary = $56,286/year, overhead = 2.40).
Поправьте перевод.
2. Ставим limit-rate на 10% меньше, чем получившаяся скорость и постоянно следим.
3. Если скорость на очередном этапе меньше установленного limit-rate — пора ещё на 10% уменьшить.
4. Если уже несколько минут ровно limit-rate — можно попробовать запустить калибрационное измерение (п.1)
Слежение за скоростью — по размеру файла или по логу wget.