openmp - cython openmp 单，屏障-6ren

openmp - cython openmp 单，屏障

In lại 作者：行者123 更新时间：2023-12-02 03:09:40

31

4

我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事:

i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。

ii) 使用#pragma omp barrier{}

有人知道如何在 cython 中执行此操作吗？

这里有更多的细节。我有一个 nogil cdef 函数 my_fun()，我在 omp for 循环中调用它:

from cython.parallel cimport prange
cimport openmp

cdef int i

with nogil:
    for i in prange(10,schedule='static', num_threads=10):
        my_func(i)

hiện hữumy_func里面我需要设置一个barrier等待所有线程 catch ，然后只在其中一个线程中执行一个耗时的操作，并且获得了gil，然后释放屏障，以便所有线程同时恢复。

cdef int my_func(...) nogil:

    ...

    # put a barrier until all threads catch up, e.g. #pragma omp barrier

    with gil:
        # execute time consuming operation in one thread only, e.g. pragma omp single{}

    # remove barrier after the above single thread has finished and continue the operation over all threads in parallel, e.g. #pragma omp barrier

    ...

1 Câu trả lời

Cython 对 openmp 有一些支持，但如果广泛使用 openmp-pragmas，用 C 编写代码并用 Cython 包装结果代码可能更容易。

作为替代方案，您可以使用 verbatim-C 代码和带有定义的技巧来为 Cython 带来一些功能，但是在定义中使用 pragma 并不直接(_Pragma Đúng C99-solution , MSVC 一如既往地使用 __pragma 做自己的事情)，有一些例子作为 Linux/gcc 的概念证明:

cdef extern from *:
    """
    #define START_OMP_PARALLEL_PRAGMA() _Pragma("omp parallel") {
    #define END_OMP_PRAGMA() }
    #define START_OMP_SINGLE_PRAGMA() _Pragma("omp single") {
    #define START_OMP_CRITICAL_PRAGMA() _Pragma("omp critical") {   
    """
    void START_OMP_PARALLEL_PRAGMA() nogil
    void END_OMP_PRAGMA() nogil
    void START_OMP_SINGLE_PRAGMA() nogil
    void START_OMP_CRITICAL_PRAGMA() nogil

我们让 Cython 相信，START_OMP_PARALLEL_PRAGMA() 和 Co. 是 nogil 函数，因此它将它们放入 C 代码中，从而被预处理器接收。

我们必须使用语法

#pragma omp single{
   //do_something
}

KHÔNG

#pragma omp single
do_something

因为 Cython 生成 C 代码的方式。

用法可能如下所示(我在这里避免使用 from cython.parallel.parallel 因为它对这个简单的例子来说太神奇了):

%%cython -c=-fopenmp --link-args=-fopenmp
cdef extern from *:# as listed above
    ...

def test_omp():
    cdef int a=0
    cdef int b=0  
    with nogil:
        START_OMP_PARALLEL_PRAGMA()
        START_OMP_SINGLE_PRAGMA()
        a+=1
        END_OMP_PRAGMA()
        START_OMP_CRITICAL_PRAGMA()
        b+=1
        END_OMP_PRAGMA() # CRITICAL
        END_OMP_PRAGMA() # PARALLEL
    print(a,b)

Gọi test_omp 在我的机器上使用 2 个线程打印“1 2”，正如预期的那样(可以使用 openmp.omp_set_num_threads(10) 更改线程数)。

但是，上面的代码仍然很脆弱——Cython 的一些错误检查可能会导致无效代码(Cython 使用 goto 来控制流程，并且不可能跳出 openmp-block)。您的示例中会发生这样的事情:

cimport numpy as np
nhập numpy dưới dạng np
def test_omp2():
    cdef np.int_t[:] a=np.zeros(1,dtype=int)

    START_OMP_SINGLE_PRAGMA()
    a[0]+=1
    END_OMP_PRAGMA()

    print(a)

由于边界检查，Cython 将产生:

START_OMP_SINGLE_PRAGMA();
...
//check bounds:
if (unlikely(__pyx_t_6 != -1)) {
    __Pyx_RaiseBufferIndexError(__pyx_t_6);
    __PYX_ERR(0, 30, __pyx_L1_error) // HERE WE GO A GOTO!
}
...
END_OMP_PRAGMA();

在这种特殊情况下，将 boundcheck 设置为 false，即

cimport cython
@cython.boundscheck(False) 
def test_omp2():
   ...

会解决上述示例的问题，但一般情况下可能不会。

再一次:在 C 中使用 openmp(并用 Cython 包装功能)是一种更愉快的体验。

作为旁注:Python 线程(由 GIL 管理的线程)和 openmp 线程是不同的，彼此之间一无所知。上面的示例也可以在不释放 GIL 的情况下正常工作(编译和运行)——openmp-threads 不关心 GIL，但由于不涉及 Python 对象，所以不会出错。因此，我已将 nogil 添加到包装的“函数”中，因此它也可以在 nogil block 中使用。

然而，当代码变得更复杂时，它变得不那么明显，不同 Python 线程之间共享的变量未被访问(所有这些都是因为这些访问可能发生在生成的 C 代码中，而这并不清楚Cython 代码)，在使用 openmp 时不释放 gil 可能更明智。

关于openmp - cython openmp 单，屏障，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57965780/

31

4

0

Bài viết được đề xuất: scala - 如何以编程方式编译和运行 Scala 代码

Bài viết được đề xuất: plot - 如何在 Gnuplot 中创建像箭头一样的流线型？

Bài viết được đề xuất: flash - Adobe HDS 的单独分段和加密步骤

Bài viết được đề xuất: vuex - 无法读取未定义的 nuxtjs vuex 的属性 '$axios'

多处理器系统上的临界区和内存栅栏/屏障
我有一个使用临界区的 Windows DLL(C 语言)。多次调用的特定例程需要在第一次调用时执行一些初始化代码，因此我使用了临界区。但是，由于它被调用了很多次，我试图避免每次调用时都进入该部分的开销
c++ - 如何使用 OpenMP 屏障
我想确保正确实现障碍。现在，每次调用 amStaticThreaded 时都会启动大量新线程。在我的主例程中，amStaticThreaded 之后的所有事情都只能由一个线程完成，但那部分速度非常快。
java - 实现自定义 Java 屏障
我想实现自定义 Java 屏障。我不想使用 CyclicBarrier class . 所以所有线程都在一个公共(public)点相遇。只有当所有线程都到达屏障时，线程才会继续。我想使用 wait/
c - 如何使用 pthreads 屏障？
您好，很抱歉发布了一大堆代码，但我对 C 代码还很陌生，基本上我正在做一项大学作业，我必须实现一个“pthread_barrier”，现在我理解了屏障的概念(或者至少我认为我这样做)但我只是不确定我应
c++ - 如何使用 boost 屏障
什么是boost:barrier，如何使用这种boost方法。你能不能给我一个清楚的例子，因为我找到了下面的例子: bool wait() { boost::mutex
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
OpenMP 线程 "disobey"omp 屏障
所以这是代码: #pragma omp parallel private (myId) { set_affinity(); myId = omp_get_thread_num(); if
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
c - C 中的 Pthread 屏障
我正在尝试创建一个 C 代码来对具有多个线程的数组进行排序，因此我需要使用屏障来同步威胁 void sort(struct ThreadArguments* args){ struct
multithreading - C++ 中的内存栅栏/屏障 : does boost or other libraries have them?
这些天我正在阅读有关内存栅栏和屏障的内容，作为同步多线程代码和避免代码重新排序的一种方法。我通常在 Linux 操作系统下使用 C++ 进行开发，并且大量使用 boost 库，但我找不到任何与之相关
c - 关于 PThread 和 PThread 屏障
我正在编写一个 SMT 程序，并且正在尝试解决一个有趣的问题。我需要所有函数一起退出，但是有些线程卡在障碍物上，即使我不希望它们这样做。我的问题是:当我删除障碍时会发生什么？卡在屏障处的线程会释放
Python/线程/屏障 : Is this a correct usage of Barrier?
可能是我没有理解线程的屏障概念。但是我写了一段代码，我想了解它是否正确使用了 barrier。代码如下: #!/usr/bin/env python3 # -*- coding: utf-8 -*-
c++ - 如何在 C++11 中实现 StoreLoad 屏障？
我想编写可移植代码(Intel、ARM、PowerPC...)来解决一个经典问题的变体: Initially: X=Y=0 Thread A: X=1 if(!Y){ do something
c++ - 是否可以为并行区域中的共享二维数组创建选择元素的线程本地拷贝？ (共享、私有(private)、屏障 : OPenMP)
我有一个 n 的二维网格x n元素。在一次迭代中，我通过平均相邻元素的值来计算一个元素的值。即: for(int i=0;i<>
c++ - 为什么我会收到使用 MPI 屏障 [c++] 的 fatal error
我是 MPI 新手，在尝试使用障碍时遇到了 fatal error 。我有一个简单的 for 循环，它以循环方式将索引分配给每个进程，紧随其后的是 MPI 屏障: mpi.cc #include #
api - 如何处理 “App is temporarily blocked from logging in with your Google account” 屏障
我正在使用 gdrive和 gshell为了与我的 Google 帐户交互并下载文件，请获取他们的信息。当我运行时:gdrive about或 gdown about ，我收到以下消息 Initia
java - 当通过屏障(例如 CyclicBarrier)的线程数量小于屏障限制时，屏障(例如 CyclicBarrier)是否会导致死锁？
运行以下代码时，2个启动线程将被CyclicBarrier *对象锁定，并无限等待第三个线程解锁 import java.util.concurrent.BrokenBarrierException;

trang đầu

đã học

Trí tuệ nhân tạo 6Ren

Trung tâm mua sắm

openmp - cython openmp 单，屏障