我意识到这可能是一个相当异端的问题,但我不知道我是否可以通过System.IO.Posix.MMap将数据文件mmap,然后将生成的ByteString的cast
转换为其他类型的严格数组?例如。如果我知道该文件包含双打,我可以以某种方式将此映射的数据导入到UArr Double中,以便我可以对它执行sumU等操作,并让虚拟内存系统为我处理IO?这基本上是我在C++代码中处理多GB数据集的方式。另外更习惯的方式来做到这一点也赞赏,谢谢!将mmapped ByteString转换为其他类型?
我也可以对数据进行多核处理的方式的最高加分:-)不是我要求苛刻或任何事情。
谢谢;我担心情况会是这样。一旦他们需要被加载到任何语言的GC'd空间,我从来没有太多的运气操纵大数据集。我目前使用的只是mmap的方法通常没问题。将复制一些减少的数据集,看看事情如何运作。 – billt 2009-09-21 17:57:48