我已经看到了这个问题的答案,但我无法弄清楚哪个答案会表现最快。这些是我见过的答案 - 哪个最好?使用每个或each_line 在Ruby中读取大文件的最快方法是什么?
- 读取一行得到
- 保存所有到使用readlines方法线的阵列,然后使用每个
- 使用grep(不知道与grep究竟是什么......)
- 使用sed(不知道究竟是什么与sed ...
- 还有其他?
另外,使用其他语言还是应该更好?
编辑:
更多细节:每行包含类似 “ID1 attr1_1 attr2_1 ID2 attr1_2 attr2_2 ... IDN attr1_n attr2_n”(n是非常大的),我需要那些插入到数据库中。对于该示例行,我需要将n行插入到数据库中。
什么是“大”文件?你在做什么?表现是否重要?你有没有尝试过基准测试? –
至少* 500,000行和每行数万个字符。对于每一行,我都会对数据库做些什么。性能确实很重要。我没有做任何基准测试,但我想知道是否有明显的答案,根据他们的工作方式,哪些答案会更快或更慢。 – user1136342
该文件是本地文件吗? – gmalette