수색…


비고

이 섹션에서는 opencl이 무엇인지, 그리고 왜 개발자가 그것을 사용하고 싶어하는지에 대한 개요를 제공합니다.

또한 opencl의 모든 큰 주제를 언급하고 관련 주제에 링크해야합니다. opencl 용 문서가 새로운 것이므로 관련 주제의 초기 버전을 만들어야 할 수도 있습니다.


Opencl은 gpus, cpus 및 기타 가속기 (pcie-fpga와 같은)를 C99과 같은 계산을 사용하지만 매우 넓은 동시성 이점을 갖는 API입니다. 설치 및 기본 구현이 완료되면 커널 문자열 (또는 해당 파일)의 간단한 변경만으로 N 개의 하드웨어 스레드에 알고리즘을 자동으로 적용합니다.

개발자는 OpenGL 또는 Direct-X에서 동일한 작업을 수행하는 것보다 메모리 공간 또는 속도를 최적화하는 것이 훨씬 쉬워지기 때문에이를 사용하려고 할 수 있습니다. 또한 로열티가 없습니다. 장치 내의 동시성은 암시 적이므로 각 장치에 대한 명시 적 멀티 스레딩이 필요 없습니다. 그러나 다중 장치 구성의 경우 CPU 멀티 스레딩이 여전히 필요합니다. 예를 들어 1000 스레드 작업이 CPU로 전송되면 스레드 동기화는 드라이버에 의해 처리됩니다. 작업 그룹의 크기 (예 : 가상 로컬 메모리로 연결된 256 개)와 동기화 지점 (필요한 경우에만)이 얼마나 큰지 알려주십시오.

gpu를 범용 작업에 사용하는 것이 거의 항상 CPU보다 빠릅니다. 일을 더 빨리 정렬하고, 매트릭스를 10 배 빠르게 늘릴 수 있으며 메모리가없는 SQL 테이블을 "아니오"시간에 조인 할 수 있습니다. 200 $ 데스크톱 급 GPP는 200 $ cpu보다 물리 (유한 요소법 유체) 작업 부하에서 더 빨리 완료됩니다. Opencl은 더 쉽고 휴대 가능합니다. C #에서 작업을 마쳤 으면 동일한 커널과 C ++ 프로젝트 (추가 C ++ 컴파일로 JNI 사용)를 사용하여 java-opencl 구현으로 쉽게 이동할 수 있습니다.

그래픽 부분에서는 항상 CPU와 GPU간에 버퍼를 보낼 필요는 없습니다. 컨텍스트 생성 부분에서 "interop"옵션을 사용하여 순수하게 gpu에서 작업 할 수 있습니다. interop을 사용하면 gpu의 제한 성능으로 Geometry를 준비 할 수 있습니다. 모든 정점 데이터에는 pci-e가 필요하지 않습니다. "명령"만 보내지고 그래픽 카드 안에서만 작업이 이루어집니다. 이는 데이터에 대한 CPU 오버 헤드가 없음을 의미합니다. Opencl은 기하학 데이터를 준비하고, OpenGL은이를 렌더링합니다. CPU가 해제됩니다. 예를 들어, cpu의 단일 스레드가 10000 사이클에서 32x32 vertied sphere를 작성할 수 있다면 opencl을 사용하는 GPU는 1000 사이클에서 20 개의 구체를 작성할 수 있습니다.


OpenCL이란 무엇입니까?

OpenCL은 L open 을 사용하는 Open C의 약자입니다. OpenCL은 GPU를 통한 CPU부터 FPGA와 같은 더 특별한 플랫폼에 이르기까지 컴퓨팅 장치 라고 불리는 이기종 플랫폼 전반의 병렬 프로그래밍을위한 프레임 워크입니다. OpenCL은 이러한 컴퓨팅 장치에서 병렬 컴퓨팅을위한 표준 인터페이스를 제공하지만 장치 간 병렬 처리도 제공합니다. C99을 기반으로하는 프로그래밍 언어와 OpenCL 지원 장치에 구현 된 기본 기능의 최소 요구 사항을 지정합니다. OpenCL은 추상적 인 컴퓨팅 및 메모리 모델을 설명하며 가능한 다른 플랫폼 간의 코드 재사용을 가능하게합니다.

선결 요건

컴퓨터 내부에 최신 CPU 또는 그래픽 카드 (GPU)가 있다면 OpenCL의 모든 단계를 시작할 수 있습니다. 귀하의 프로세서가 OpenCL 가능 여부를 확인하는 것은 일반적으로 제조업체의 홈페이지에서 할 수 있습니다. 먼저 좋은 시작은

https://www.khronos.org/conformance/adopters/conformant-products#opencl

OpenCL이란 무엇입니까?

OpenCL (Open Computing Language)은 CPU, GPU 및 기타 병렬 프로세서와 가속기에서 실행되는 프로그램을 작성하기위한 프레임 워크입니다.

OpenCL은 지정된 온칩 메모리에 대한 액세스를 제공하는 프로그래밍 언어 (C 기반), 병렬로 작업을 실행하기위한 모델 및 이러한 작업을 동기화하는 기능을 지정합니다.

OpenCL 1.2의 C # 구현 : 64 비트 창에서 AMD 시스템 용 플랫폼 수

OpenCL은 낮은 수준의 API이므로 먼저 "C 공간"에 구현해야합니다. 이를 위해 Khronos 사이트에서 헤더 파일을 다운로드해야합니다. 제 하드웨어는 AMD이고 버전 1.2는 가능합니다.

opencl.h 
cl_platform.h 
cl.h 
cl_ext.h 
cl_egl.h 
cl_dx9_media_sharing.h 
cl_d3d10.h 
cl_d3d11.h 
cl_gl.h 
cl_gl_ext.h 
cl.hpp

이 페이지에서

이러한 파일을 프로젝트에 추가하고 적절한 바이너리 (및 라이브러리) 파일 위치를 설정 한 후에 C ++ 바인딩에 충분해야합니다 (

$ (AMDAPPSDKROOT) \ lib \ x86_64 (64 비트 amd 라이브러리 용) (amd app sdk의 라이브러리 권장)

,

64 비트 opencl.dll의 경우 C : \ Windows \ SysWOW64 (ICD가 Linux 시스템 인 경우 .so 파일)

예를 들어 Intel-Nvidia의 경우), 적절한 드라이버 (amd에 대한 crimson과 같은)를 설치 한 후 플랫폼 목록 (amd, intel, xilinx, nvidia)을 쿼리 할 수 ​​있습니다. 드라이버는 (ICD를 사용하는) opencl 애플리케이션을 실행하기위한 것이며, 라이브러리와 헤더 파일은 개발을위한 것입니다.

플랫폼 쿼리 :

#define __CL_ENABLE_EXCEPTIONS
#include "stdafx.h"
#include <vector>
#include <CL/cl.hpp>

extern "C"
    {
       // when this class is created, it contains a list of platforms in "platforms" field.
       class OpenClPlatformList
       {
           public:
               std::vector<cl::Platform> platforms;
               int platformNum;
               OpenClPlatformList()
               {
                   platforms= std::vector< cl::Platform>();
                   cl::Platform::get(&platforms);
                   platformNum= platforms.size();
               }
        };


        // this is seen from C# when imported. Creates an object in memory.
        __declspec(dllexport)
            OpenClPlatformList * createPlatformList()
        {
            return new OpenClPlatformList();
        }

        __declspec(dllexport)
            int platformNumber(OpenClPlatformList * hList)
        {
            return hList->platformNum;
        }


        __declspec(dllexport)
            void deletePlatformList(OpenClPlatformList * p)
        {
            if (p != NULL)
                delete p;
            p = NULL;
        }


    }

DLL (예 : OCLImplementation.dll)에 내장 될 수 있습니다.

C # 측에서 사용하려면,

using System;
using System.Collections.Generic;
using System.Runtime.InteropServices;


namespace WrapperCSharp
{
    public class WrapperCSharp
    {
        [DllImport("OCLImplementation", CallingConvention = CallingConvention.Cdecl)]
        private static extern IntPtr createPlatformList();

        [DllImport("OCLImplementation", CallingConvention = CallingConvention.Cdecl)]
        private static extern int platformNumber(IntPtr hList);

        [DllImport("OCLImplementation", CallingConvention = CallingConvention.Cdecl)]
        private static extern void deletePlatformList(IntPtr hList);
    }
}

물론 dll은 C # 프로젝트에서 볼 수 있어야하며 프로젝트의 실행 가능 파일 가까이에 놓기 만하면 해결됩니다.

이제 샘플 컴퓨터에 적어도 하나의 opencl-capable 플랫폼이 있다면,

IntPtr platformList = createPlatformList(); // just an address in C-space
int totalPlatforms = platformNumber(platformList); // AMD+NVIDIA systems should have "2"
deletePlatformList(platformList); //

totalPlatforms 변수는 적어도 "1"값을 가져야합니다. 그런 다음 추가 기능을 사용하여 C 공간에서 다양한 플랫폼을 사용하여 모든 플랫폼에서 CPU, GPU 및 phi 또는 일부 fpga와 같은 특수 목적 가속기와 같은 모든 장치를 쿼리 할 수 ​​있습니다.

C ++ 랩퍼에 이러한 모든 C ++ 래퍼를 시간이 중요한 프로젝트에 단순히 쓰는 것은 아닙니다. C #, Java 및 다른 언어로 작성된 많은 래퍼가 있습니다. 자바의 경우 "Java 바이트 코드 대 opencl-c"변환기 api가 있습니다.이 API는 순수하게 Java에서 gpu 병렬 버전으로 쓸 때 사용할 수 있도록 다소 유용합니다.

OpenCL 및 C #

C #에는 OpenCL과 통신 할 수있는 인터페이스를 제공하는 많은 래퍼가 있습니다.

  • OpenCL.NET :이 패키지는 가장 낮은 수준의 래퍼 중 하나입니다. 그것은 추상화를 전혀 추가하지 않고도 C # 용 OpenCL API의 완전한 구현을 제공합니다. 따라서 C ++ 예제는이 라이브러리에 쉽게 포팅됩니다. 유일한 프로젝트 페이지는 현재 codeplex에 있으며, 2011 년 12 월 15 일에 종료되지만 패키지는 NuGet에서 사용할 수 있습니다.

https://openclnet.codeplex.com/

  • NOpenCL :이 라이브러리는 C #과 OpenCL 사이의 추상 인터페이스를 제공합니다.

단기 목표는 성능 저하없이 OpenCL의 모든 기능에 대한 액세스를 제공하는 사용하기 쉬운 추상 레이어를 제공하는 것입니다.

https://github.com/tunnelvisionlabs/NOpenCL

  • Cloo :

Cloo는 .NET / Mono 응용 프로그램이 OpenCL 프레임 워크를 최대한 활용할 수있게 해주는 사용하기 쉬운 관리 형 라이브러리 인 오픈 소스입니다.

https://sourceforge.net/projects/cloo/



Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow