2013-04-27 219 views
1

我一直在阅读C++并发的行动书,这里是使用期货实现并行快速排序的书中的例子。并行快速排序由单线程快速排序

但我发现这个函数比单线程快速排序函数慢两倍以上,而不使用C++标准库中的任何异步工具。 使用g ++ 4.8和visual C++ 2012进行测试。

我用10M随机整数来测试,并且在visual C++ 2012中,这个函数总共产生了6个线程来执行我的四核PC中的操作。

我对性能非常困惑。任何人都可以告诉我为什么?

template<typename T> 
std::list<T> parallel_quick_sort(std::list<T> input) 
{ 
    if(input.empty()) 
    { 
     return input; 
    } 
    std::list<T> result; 
    result.splice(result.begin(),input,input.begin()); 
    T const& pivot=*result.begin(); 
    auto divide_point=std::partition(input.begin(),input.end(), 
     [&](T const& t){return t<pivot;}); 
    std::list<T> lower_part; 
    lower_part.splice(lower_part.end(),input,input.begin(), 
     divide_point); 
    std::future<std::list<T> > new_lower(
     std::async(&parallel_quick_sort<T>,std::move(lower_part))); 
    auto new_higher(
     parallel_quick_sort(std::move(input))); 
    result.splice(result.end(),new_higher); 
    result.splice(result.begin(),new_lower.get()); 
    return result; 
} 
+0

也显示您的单线程版本 - 您可能花费大量额外时间将数据复制到/从'结果'而不是在排序中的示例代码... – 2013-04-27 04:32:50

+0

我遵循同一本书,对我而言,它工作得更快。此外,我通过https://www.youtube.com/watch?v=zE9N-KrsMBc&t=126s – Kasun 2017-08-10 13:58:06

回答

1

该代码只是可怕的次优。例如,为什么不是std::list<T> result(input)?为什么不是parallel_quick_sort(const std::list<T>& input?简介它,我敢打赌你会发现各种可怕的事情。在你弄懂代码的性能之前,你必须确保它花时间去做你认为它正在做的事情!

+0

得到了更多的见解,我真的怀疑这一点(并提供测试结果)。这基本上是A.Williams(boost线程实现者)的“C++ Concurency in action”中的并行快速排序实现。使用std :: move,并行算法在大数据上运行速度明显加快。我很怀疑大数据量的快速排序的结果。 – SChepurin 2013-04-28 08:40:51