我已经写了一些CSV文件,压缩它,使用此代码:读取压缩csv文件上即时
arr = (0...2**16).to_a
File.open('file.bz2', 'wb') do |f|
writer = Bzip2::Writer.new f
CSV(writer) do |csv|
(2**16).times { csv << arr }
end
writer.close
end
我想读这个CSV bzip2ed文件(用bzip2压缩的CSV文件) 。这些文件未压缩的样子:
1,2
4,12
5,2
8,7
1,3
...
所以,我想这个代码:
Bzip2::Reader.open(filename) do |bzip2|
CSV.foreach(bzip2) do |row|
puts row.inspect
end
end
,但在执行时,它抛出:
/Users/foo/.rvm/rubies/ruby-2.1.0/lib/ruby/2.1.0/csv.rb:1256:in `initialize': no implicit conversion of Bzip2::Reader into String (TypeError)
from /Users/foo/.rvm/rubies/ruby-2.1.0/lib/ruby/2.1.0/csv.rb:1256:in `open'
from /Users/foo/.rvm/rubies/ruby-2.1.0/lib/ruby/2.1.0/csv.rb:1256:in `open'
from /Users/foo/.rvm/rubies/ruby-2.1.0/lib/ruby/2.1.0/csv.rb:1121:in `foreach'
from worm_pathfinder_solver.rb:79:in `block in <main>'
from worm_pathfinder_solver.rb:77:in `open'
from worm_pathfinder_solver.rb:77:in `<main>'
问题:
哪里不对? 我该怎么办?
我认为这是错误的 - 它应该是{{CSV.parse(bzip2.read)do ...}}。当然,这一次将整个文件读入所有文件,这可能代价高昂 - 我们通常会压缩原因 - 而其他答案似乎允许逐行处理,而无需将文件读入内存。 –