1
给出一个包含有一个熊猫HDFStore之间差异DataFrame
:熊猫HDFStore:使用选择功能,可直接进入
import pandas as pd
import numpy.random as rd
df = pd.DataFrame(rd.randn(int(1000)).reshape(500, 2), columns=list('ab'))
store = pd.HDFStore('store.h5')
store.append('df', df, data_columns=['a', 'b'])
我可以使用select
函数来检索数据的子集,像这样:
store.select('df', ['a > 0', 'b > 0'])
不过,我可以回落到那种命令的,如果我是使用纯DataFrame
,这不是在HDFStore
我可能会用得到的结果相同:
store.df[(store.df.a > 0) & (store.df.b > 0)]
这两种方法有区别吗?如果是这样,有什么区别?