2014-09-01 45 views
0

我将100个csv文件转换为数据框并将它们存储在HDFStore中。将多个文件或单个文件导入HDFStore

什么是

一个利弊 - 存储csv文件100个不同HDFStore文件?

b - 将所有csv文件作为单独的项目存储在单个HDFStore中?

除了性能问题,我问的问题是我有稳定性问题,我的HDFStore文件经常被损坏。所以,对我而言,单个HDFStore存在风险。但是,我想知道是否有单一商店的好处。

+0

参见复制分组属性:HTTP://计算器.COM /问题/ 25130511 /如何-DO-I-读写到一个子群 - withing-A-hdf5store – 2014-09-01 09:50:05

回答

1

这些差异:

多个文件

使用,你可以书写时只损坏一个文件中的多个文件时
  1. (例如你有一个电源故障写入时)
  2. 可以并行写多个文件(注意 - 永远不要尝试与单个文件并行,这会损坏它!)

单个文件

  1. 分组,如果逻辑组

恕我直言多个文件的利大于弊使用一个单一的文件,你可以很容易地通过使用子目录