Поиск…


Аппроксимация PI с использованием предложения #pragma omp

h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h) reduction(+:area) 
for (i = 1; i <= n; i++)
{
  x = h * (i - 0.5);
  area += (4.0 / (1.0 + x*x));
}
pi = h * area;

В этом примере каждый поток выполняет подмножество счетчика итераций. Каждый поток имеет свою локальную частную копию area и в конце параллельной области все они применяют операцию добавления ( + ), чтобы генерировать конечное значение для area .

Приближение PI с использованием сокращений на основе #pragma omp критического

h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area) 
for (i = 1; i <= n; i++)
{
  x = h * (i - 0.5);
  #pragma omp critical
  {
    area += (4.0 / (1.0 + x*x));
  }
}
pi = h * area;

В этом примере, каждый из которых потоков выполняются подмножеством подсчета итераций и они накапливаются атомарны в общую переменную area , которая гарантирует , что нет потерянных обновлений.

Аппроксимация PI с использованием сокращений на основе #pragma atomic

h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area) 
for (i = 1; i <= n; i++)
{
  x = h * (i - 0.5);
  #pragma atomic
  area += (4.0 / (1.0 + x*x));
}
pi = h * area;

В этом примере, каждый из которых потоков выполняются подмножеством подсчета итераций и они накапливаются атомарны в общую переменную area , которая гарантирует , что нет потерянных обновлений. Здесь мы можем использовать #pragma atomic потому что данная операция ( += ) может выполняться атомарно, что упрощает читаемость по сравнению с использованием #pragma omp critical .

Аппроксимация PI ручной обработки #pragma omp reduction

h = 1.0 / n;

#pragma omp parallel private(x) shared(n, h)
{
  double thread_area = 0;                      // Private / local variable

  #pragma omp for
  for (i = 1; i <= n; i++)
  {
    x = h * (i - 0.5);
    thread_area += (4.0 / (1.0 + x*x));
  }

  #pragma omp atomic                       // Applies the reduction manually
  area += thread_area;                     // All threads aggregate into area
}

pi = h * area;

Нити появляются в #pragma omp parallel . Каждый поток будет иметь независимую / private thread_area которая сохраняет свое частичное дополнение. Следующий цикл распределяется между потоками с помощью #pragma omp for . В этом цикле каждый поток вычисляет свою собственную thread_area и после этого цикла код последовательно агрегирует область атомарно через #pragma omp atomic .



Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow