openmp
Сокращения OpenMP
Поиск…
Аппроксимация PI с использованием предложения #pragma omp
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h) reduction(+:area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
area += (4.0 / (1.0 + x*x));
}
pi = h * area;
В этом примере каждый поток выполняет подмножество счетчика итераций. Каждый поток имеет свою локальную частную копию area
и в конце параллельной области все они применяют операцию добавления ( +
), чтобы генерировать конечное значение для area
.
Приближение PI с использованием сокращений на основе #pragma omp критического
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
#pragma omp critical
{
area += (4.0 / (1.0 + x*x));
}
}
pi = h * area;
В этом примере, каждый из которых потоков выполняются подмножеством подсчета итераций и они накапливаются атомарны в общую переменную area
, которая гарантирует , что нет потерянных обновлений.
Аппроксимация PI с использованием сокращений на основе #pragma atomic
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
#pragma atomic
area += (4.0 / (1.0 + x*x));
}
pi = h * area;
В этом примере, каждый из которых потоков выполняются подмножеством подсчета итераций и они накапливаются атомарны в общую переменную area
, которая гарантирует , что нет потерянных обновлений. Здесь мы можем использовать #pragma atomic
потому что данная операция ( +=
) может выполняться атомарно, что упрощает читаемость по сравнению с использованием #pragma omp critical
.
Аппроксимация PI ручной обработки #pragma omp reduction
h = 1.0 / n;
#pragma omp parallel private(x) shared(n, h)
{
double thread_area = 0; // Private / local variable
#pragma omp for
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
thread_area += (4.0 / (1.0 + x*x));
}
#pragma omp atomic // Applies the reduction manually
area += thread_area; // All threads aggregate into area
}
pi = h * area;
Нити появляются в #pragma omp parallel
. Каждый поток будет иметь независимую / private thread_area
которая сохраняет свое частичное дополнение. Следующий цикл распределяется между потоками с помощью #pragma omp for
. В этом цикле каждый поток вычисляет свою собственную thread_area
и после этого цикла код последовательно агрегирует область атомарно через #pragma omp atomic
.