Я работал с Татьяной в одной команде в Интел, так что примерно представляю, как все происходило. Никто никого не выкидывал, да и не за что было, если говорить про нее. Не стоит говорить не зная ситуации. Плюс, поверьте, возможностей на рынке C и C++ разработчиков хватает, к тому же с таким опытом и знаниями.
Да, я понимаю. Про OpenMP я спросил, так как эта технология позволяет векторизовать код используя директивы препроцессора.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
Спасибо! Интересная статья. Пробовали ли вы использовать возможности, например, OpenMP 4.5 (или какие-либо другие технологии) для применения векторизации вместо интринсиков, чтобы снизить расходы на реализацию и поддержку кода и новых наборов инструкций? Если пробовали, насколько различается производительность на разных поколениях hardware?
Переходы делаются нечасто и стоят дешево (не больше 1%). Поэтому больше интересует эффективность самих графовых алгоритмов (максимальный поток в сети, кратчайший путь, кратчайших путь во взвешенном графе и т.д.) на GPU и сопроцессорах относительно CPU.
Я сам когда-то занимался данной тематикой. Возник вопрос, данный алгоритм новый и придуман вами или все тот же, что и лет ~5 назад? Если нет, попробую использовать ваш :)
И еще один вопрос касательно структуры графов. Вы написали что используете RMAT. А что, если степень связности будет ниже, например, 5 или 6? Будет ли алгоритм также эффективен относительно CPU? Вопрос имеет прикладной характер, так как в некоторых задачах моделирования очень часто приходится переходить от сеток к графам.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
И еще один вопрос касательно структуры графов. Вы написали что используете RMAT. А что, если степень связности будет ниже, например, 5 или 6? Будет ли алгоритм также эффективен относительно CPU? Вопрос имеет прикладной характер, так как в некоторых задачах моделирования очень часто приходится переходить от сеток к графам.