2011-04-25 23 views

回答

1

我最终自己使用'算法'gem中的数据结构来编写它。这并没有我想象的那么糟糕。

require 'algorithms' 

class LazyHeapMerger 
    def initialize(sorted_arrays) 
    @heap = Containers::Heap.new { |x, y| (x.first <=> y.first) == -1 } 
    sorted_arrays.each do |a| 
     q = Containers::Queue.new(a) 
     @heap.push([q.pop, q]) 
    end 
    end 

    def each 
    while @heap.length > 0 
     value, q = @heap.pop 
     @heap.push([q.pop, q]) if q.size > 0 
     yield value 
    end 
    end 
end 

m = LazyHeapMerger.new([[1, 2], [3, 5], [4]]) 
m.each do |o| 
    puts o 
end 
+0

保持队列上下文有趣的方法。唯一的缺点是代码为每个值拉创建一个新的Array对象,这使得垃圾回收器工作。 – Sim 2013-01-24 01:29:52

0

不,没有什么内置的做到这一点。至少,没有什么会立即想到。然而,几年前有一个GSoC project来实现相关的数据类型,您可以使用它。

+0

它看起来像堆会工作,除非它不是懒惰的事实。太糟糕了,谢谢你的建议,其他算法可能会在稍后派上用场。 – guidoism 2011-04-25 22:33:22

1

下面是一个(略golfed)解决方案,应该在支持#first#shift,并#empty?任何名单样“收藏的数组。请注意,它具有破坏性 - 每次拨打lazymerge时,都会从一个集合中删除一个项目。

def minheap a,i 
    r=(l=2*(m=i)+1)+1 #get l,r index 
    m = l if l< a.size and a[l].first < a[m].first 
    m = r if r< a.size and a[r].first < a[m].first 
    (a[i],a[m]=a[m],a[i];minheap(a,m)) if (m!=i) 
end 


def lazymerge a 
    (a.size/2).downto(1){|i|minheap(a,i)} 
    r = a[0].shift 
    a[0]=a.pop if a[0].empty? 
    return r 
end 

p arrs = [ [1,2,3], [2,4,5], [4,5,6],[3,4,5]] 
v=true 
puts "Extracted #{v=lazymerge (arrs)}. Arr= #{arrs.inspect}" while v 

输出:

[[1, 2, 3], [2, 4, 5], [4, 5, 6], [3, 4, 5]] 
Extracted 1. Arr= [[2, 3], [2, 4, 5], [4, 5, 6], [3, 4, 5]] 
Extracted 2. Arr= [[3], [2, 4, 5], [4, 5, 6], [3, 4, 5]] 
Extracted 2. Arr= [[4, 5], [3], [4, 5, 6], [3, 4, 5]] 
Extracted 3. Arr= [[4, 5], [3, 4, 5], [4, 5, 6]] 
Extracted 3. Arr= [[4, 5], [4, 5], [4, 5, 6]] 
Extracted 4. Arr= [[5], [4, 5], [4, 5, 6]] 
Extracted 4. Arr= [[5], [5], [4, 5, 6]] 
Extracted 4. Arr= [[5, 6], [5], [5]] 
Extracted 5. Arr= [[6], [5], [5]] 
Extracted 5. Arr= [[5], [6]] 
Extracted 5. Arr= [[6]] 
Extracted 6. Arr= [[]] 
Extracted . Arr= [[]] 

还要注意,这种算法也懒得保持堆的特性 - 它不保持通话之间。这可能会导致它做更多的工作,因为它会在每次后续的呼叫中完成堆积。这可以通过先完成一次完整的堆垛来修复,然后在return r之前呼叫minheap(a,0)

1

这是一个应该在任何Enumerable上工作的实现,甚至是无限的。它返回枚举器。

def lazy_merge *list 
    list.map!(&:enum_for) # get an enumerator for each collection 
    Enumerator.new do |yielder| 
    hash = list.each_with_object({}){ |enum, hash| 
     begin 
     hash[enum] = enum.next 
     rescue StopIteration 
     # skip empty enumerators 
     end 
    } 
    loop do 
     raise StopIteration if hash.empty? 

     enum, value = hash.min_by{|k,v| v} 
     yielder.yield value 
     begin 
     hash[enum] = enum.next 
     rescue StopIteration 
     hash.delete(enum) # remove enumerator that we already processed 
     end 
    end 
    end 
end 

Infinity = 1.0/0 # easy way to get infinite range 

p lazy_merge([1, 3, 5, 8], (2..4), (6..Infinity), []).take(12) 
#=> [1, 2, 3, 3, 4, 5, 6, 7, 8, 8, 9, 10]