Comments 5
На чипе Intel он быстрее на крайне малую долю.
Подумал что в переводе ошибка и полез в оригинал проверять - так и есть.
On the Intel chip it's faster by a very significant margin. - На процессоре Intel он работает значительно быстрее.
А то странно прирост в 47-89% называть крайне малой долей, и при этом прирост на Apple в 4% считать заметным.
Так как это перевод - автор так и не узнает, что:
1) Аппроксимация Паде - это частный случай рациональной аппроксимации и не самый оптимальный, а просто наиболее удобный для аналитического вычисления. Оптимальный - это полученный численно минимаксом.
2) найденное им (чужое) решение тоже не самое быстрое как минимум из-за корня. Самое быстрое будет - разбить функцию на диапазоны и каждый считать по отдельности многочленом 3-й степени, коэффициенты которого получены или численно, или через многочлены Чебышева.
3) когда речь идёт об аппроксимации, первое, с чего надо начинать - это определиться с необходимой точностью. Для графики точность в 3 значащих цифры обычно более чем достаточна.
По второму пункту поясните, пожалуйста, как правильно выбирать диапазоны?
Вы используете asin, чтобы текстуру в цилиндрической проекции изобразить?
Можно проецировать шар на куб и текстура будет на шести квадратах, вместо арксинуса будет деление. Самый лучший способ вычисления функции -- когда она исключается на этапе аналитических выкладок.
Более быстрый asin()