2014-05-12 59 views
1

比方说,我从两个包含日期索引的csv数据中提取了pandas自动拉出的数据,这是原始列​​之一。结合2个数据帧和不同日期索引的大熊猫

import pandas as pd 
df1 = pd.io.parsers.read_csv(data1, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A']) 
df2 = pd.io.parsers.read_csv(data2, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A']) 

现在对于一个CSV文件中的日期比其他不同,但与read_csv加载,日期将被明确定义。我已经尝试了连接命令,但它似乎并不保存日期。

df1 = df1.join(df2) 

我得到一个有效的数据帧,但日期范围是固定的,以什么样的原始范围应给予日期两个csv文件之间的悬殊一些较小的子集。我想要的是创建一个包含NaN的2列(包含'A'列)的单个数据框或自动填入非重叠日期的零值的方法。有没有一个简单的解决方案,或者有什么我可能会在这里失踪。非常感谢。

+0

你想要什么叫外连接,并与'how'参数控制,参见[在文档(http://pandas.pydata.org/ pandas-docs/stable/merging.html) – alko

回答