Pull to refresh
39
-1
Иван Камынин @IvanKamynin

Программист

Send message

Да, все верно. Хотя, в статье по вашей ссылке автор пишет:

Кроме того, нам совсем не обязательно полностью сортировать массив, достаточно, что бы в 4-м элементе было требуемое нами значение. 

К этому можно относиться несерьезно, но практические задачи где это нужно - существуют.

Код легко переделать на float. Профит получен - и в моей конкретной задаче, которую я описал в самом начале в частности. То, что это непростая оптимизация, я не спорю. Но такие оптимизации даже очень важны. В HFT, скажем, такое очень нужно(я не про этот конкретный алгоритм сортировок). Но что конкретно вы мне хотите доказать? С CUDA еще не факт, что было бы быстрее - все таки гонять малые данные по шине не быстро. Цель статьи - показать что SIMD находит свое применение не только в оптимизации memcpy. И показываю и рассказываю как. Миллионы этим кодом никто не зарабатывает, а усилия которые я трачу, я трачу на свое образование и по своему усмотрению.

Нет. Результаты - построчные. Я в статье указал какая строка за stl отвечает, а какая за другие в т.ч и мою битонную реализацию.

Можете и руками, но будет ли это быстрее чем SIMD? В Яндексе были задачи где это оказалось применимо(в рамках приличного ускорения).

Приятно читать коллег :)

Ну да, если 4 символа в строке, то все хорошо, а если меньше — нет. Скажем, если 1.
Это известный трюк?

UPD: А не работает ж, как надо. Но в целом, идея этого метода, она позаимствована из уже существующего алгоритма?
Не знаю, как оно на самом деле, все же, Ruy свой аплгоритм выпустил в 2018 году, и вроде, даже в springer! Моя цель, это рассказывать скорее о интересном, под новым углом.
Код бенчмарка был позаимствован у abseil — хочется верить, что ребята разбираются.

Вот эта статья, топ.

Очень поверхностно и сыро. Ну упоминается в статье дважды Metal, и еще пару раз Vulkan. Но, о их преимуществах рессказано немного(ничего то есть), уже не говоря о профессиональных деталях. Не говорится также, что эти api не только способствуют росту FPS(если все это хорошенько распараллелить, и рисовать 'наперед'), но и уменьшают энергопотребление, что способствует возможности поиграть подольше. Обычно, у playrix все подробно, а тут, как мне показалось, довольно скудно.

А да, на иконке художника в конце поста не птичка, а птах :)

Да, новая версия cubicity определенно хороша, но, видимо шанс на то, чтобы поймать волну дается лишь однажды при старте. Я верю в то, что вы способны делать хорошие и интересные игры, которые смогут найти огромную аудиторию. Успехов.

Вот, что мне нравится у вас, ребята — то, что к разработке вы подходите качественно: красивая графика, современные технологии, грамотный подход к продвижению кампании(многие ли игровые кампанми имеют блог на хабре, уж не говоря о слове — Интересный?) и многое другое. По статье увы, ничего написать не могу — все в статье и написано. Просто r3sp3c7 за качество, труд.

Не читал, если что. А смысл статьи больше лежит в последних абзацах. Но за источник — спасибо, я себя открывателем не называл!
Как-то так, да. А это, точно приводит к потере точности для числе больших 2^53.
Ну, сложно сказать — если контора математическая, код документируется, то вроде должно быть ОК. Собственно, в Алгоритме Ruy(printf) — сделано умножением, правда, со сдвигами. То есть, сий инженер из g00gl3 по факту написал тоже самое, что делают компиляторы видя / 10, оставив все теже сдвиги :]
Комментарий выше надо б удалить, по ссылке — реклама.
Именно. В моей статье, достаточно просто взять binary rep. описанный и перевести в hex. Самое главное — магии нету никакой!
1

Information

Rating
Does not participate
Location
Нижний Новгород, Нижегородская обл., Россия
Date of birth
Registered
Activity