2017-01-16 64 views
5

我目前正在探索boost_compute。不幸的是,文档页面和示例较少,比我需要了解要做什么。如何调用boost_compute'BOOST_COMPUTE_FUNCTION'定义的函数?

考虑下面的代码缩小的:

BOOST_COMPUTE_FUNCTION(bool, add, (int* values, int* results, int constant), 
{ 
    // Whats the indexing variable? 
    // In opencl it would be get_global_id(0) 
    int index = // ? 

    results[index] = values[index] + values[index + 1] + values[index + 2] + constant; 
}); 

void compute(float* results, compute::context* ctx, compute::command_queue* queue) 
{ 
    compute::vector<float> device_values(100, *ctx); 
    compute::vector<float> device_results(98, *ctx); 

    compute::copy(
     parameters->values.begin(), parameters->values.end(), device_values.begin(), *queue 
    ); 

    // Actual computation 
    // HOW TO CALL 'add' for every device_results element? 

    compute::copy(
     device_results.begin(), device_results.end(), results, *queue 
    ); 
} 

如何调用“添加”功能,这是什么函数内的迭代变量?此外,我需要这种代码结构来进行更复杂的计算。

亲切的问候, 托尼

+0

使用'计算:: transform',在这里的例子:http://www.boost.org/doc/libs/1_63_0/libs/compute/doc/html/boost_compute/advanced_topics.html# boost_compute.advanced_topics.custom_functions – ddemidov

+0

boost :: compute中的函数应用于单个向量元素。你可能在寻找的是一个定制的内核。 – ddemidov

+0

不幸的是,我无法想象调用正确的方式进行转换。这个例子没有回答我任何问题:/ – infotoni91

回答

1

总之boost:compute功能OpenCL内核函数。它们更像是OpenGL内核函数。

我相信你的功能需要太多的参数才能用于boost:compute算法。
然而,稍微简单的功能,只是增加相邻值不恒定的,应该是:

BOOST_COMPUTE_FUNCTION(boost::compute::float_, add, 
         (boost::compute::float_ values0, boost::compute::float_ values1), 
{ 
    return values0 + values1; 
}); 

而且可以使用boost::compute::transform作为@ddemidov建议被称为:

boost::compute::transform(values.begin(), values.end() -1, // values0 
          values.begin() +1, // values1 
          results.begin(), // results 
          add, queue); 

它可能会以使用boost::compute::lambda函数来实现您的功能。例如:

using namespace boost::compute::lambda; 

float c = 1.234; // some constant 

boost::compute::transform(values.begin(), values.end() -1, // values0 
          values.begin() +1, // values1 
          results.begin(), // results 
          _1 + _2 + c, queue); 

但它仍然是短一组值的...

你的函数可以在boost:compute使用被写成一个OpenCL内核BOOST_COMPUTE_STRINGIZE_SOURCE宏:

const char kernel_function_source[] = BOOST_COMPUTE_STRINGIZE_SOURCE(

    kernel void add(global float* values, global float* results, global float* constant) 
    { 
    size_t index = get_global_id(0); 
    results[index] = values[index] + values[index + 1] + values[index + 2] + *constant; 
    } 

); 

后您已经构建了内核程序并创建了内核(使用boost::compute::program),可以单独设置内核参数并调用boost::compute::command_queueenqueue_1d_range_kernel函数:

kernel.set_arg(0, values.get_buffer()); 
kernel.set_arg(1, results.get_buffer()); 
kernel.set_arg(2, &constant); 
queue.enqueue_1d_range_kernel(kernel, 0, count, 0); 
+0

非常感谢!不幸的是,在kernel.hpp中对'clCreateKernel'的调用会导致一个空的内核抛出异常。然而,Plain OpenCL就像一个魅力。 – infotoni91

相关问题