openmp
Réductions OpenMP
Recherche…
Approximation de PI en utilisant la clause de réduction #pragma omp
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h) reduction(+:area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
area += (4.0 / (1.0 + x*x));
}
pi = h * area;
Dans cet exemple, chaque thread exécute un sous-ensemble du nombre d'itérations. Chaque thread a sa copie privée locale de la area
et à la fin de la région parallèle, ils appliquent tous l'opération d'ajout ( +
) afin de générer la valeur finale pour la area
.
Approximation de PI en utilisant des réductions basées sur #pragma omp critical
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
#pragma omp critical
{
area += (4.0 / (1.0 + x*x));
}
}
pi = h * area;
Dans cet exemple, chaque thread exécute un sous-ensemble du nombre d'itérations et il s'accumule de manière atomique dans la area
variable partagée, ce qui garantit qu'il n'y a pas de mises à jour perdues.
Approximation de PI en utilisant des réductions basées sur #pragma atomic
h = 1.0 / n;
#pragma omp parallel for private(x) shared(n, h, area)
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
#pragma atomic
area += (4.0 / (1.0 + x*x));
}
pi = h * area;
Dans cet exemple, chaque thread exécute un sous-ensemble du nombre d'itérations et il s'accumule de manière atomique dans la area
variable partagée, ce qui garantit qu'il n'y a pas de mises à jour perdues. Nous pouvons utiliser l' #pragma atomic
ici car l'opération donnée ( +=
) peut être effectuée de manière atomique, ce qui simplifie la lisibilité par rapport à l'utilisation du #pragma omp critical
.
Approximation de la fabrication artisanale de PI la réduction #pragma omp
h = 1.0 / n;
#pragma omp parallel private(x) shared(n, h)
{
double thread_area = 0; // Private / local variable
#pragma omp for
for (i = 1; i <= n; i++)
{
x = h * (i - 0.5);
thread_area += (4.0 / (1.0 + x*x));
}
#pragma omp atomic // Applies the reduction manually
area += thread_area; // All threads aggregate into area
}
pi = h * area;
Les threads sont générés dans le #pragma omp parallel
. Chaque thread aura un thread_area
indépendant / privé qui thread_area
son ajout partiel. La boucle suivante est distribuée entre les threads utilisant #pragma omp for
. Dans cette boucle, chaque thread calcule ses propres thread_area
et après cette boucle, le code agrège séquentiellement la zone de manière atomique via #pragma omp atomic
.