Andrey2008 Feb 23 2010 at 09:17

Параллельные заметки №3 — базовые конструкции OpenMP

5 min

85K

Intel corporate blog

+21

Comments 7

spiff Feb 24 2010 at 07:36

Хороший, краткий, доступный обзор. Буду ждать продолжения.

sergehog Feb 24 2010 at 10:41

Супер!
Каждый раз когда писал громоздкие «for» мечтал о подобной параллелизации. В ближайшее же время опробую.

Вот еще какой вопрос знатокам, сложно ли это прикрутить это к gcc или другим компиляторам кроме Visual Studio?

spybot Feb 24 2010 at 10:53

GCC поддерживает OpenMP с версии 4.2.

reddot Feb 26 2010 at 12:32

reddot@doone:~/default/samples/openmp$ sudo apt-get install libgomp1
reddot@doone:~/default/samples/openmp$ cat hello.c
#include <stdio.h>

int main()
{
#pragma omp parallel
printf(«hello world\n»);
return 0;
}

reddot@doone:~/default/samples/openmp$ gcc -Wall -Wextra -fopenmp hello.c
reddot@doone:~/default/samples/openmp$ ./a.out
hello world
hello world

Unforgiven Feb 24 2010 at 11:31

Есть ли средства отладки (оч желательно — бесплатные), чтобы увидеть сколько потоков запущены, какие переменные в каждом из них, над какими данными выполняются операции и т д...?

izard Feb 24 2010 at 16:42

Intel Thread profiler — показывает достаточно наглядно, но это не совсем отладчик. Бесплатный первый месяц, потом можно повторить.

SvyatoslavMC Jun 4 2016 at 12:17

#pragma omp parallel for
for (ptrdiff_t i = 0; i < n; i++)
  dst[i] = sqrt(src[i]);

На практике столкнулся с параллельным заполнением огромных матриц. Если элементы матрицы заполняются по одинаковой простой формуле, то эффективнее будет изменить планировщик потоков:

#pragma omp parallel for schedule(static)

Анализ производительности микроархитектуры показал, что промахи кэша 1го и 2го уровней значительно уменьшаются, повышая когерентность кэша. Время заполнения матрицы возрастает. На процессорах с маленьким кэшем разница особенно заметна.