结合2个数据帧和不同日期索引的大熊猫

比方说，我从两个包含日期索引的csv数据中提取了pandas自动拉出的数据，这是原始列之一。结合2个数据帧和不同日期索引的大熊猫

import pandas as pd 
df1 = pd.io.parsers.read_csv(data1, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A']) 
df2 = pd.io.parsers.read_csv(data2, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A'])

现在对于一个CSV文件中的日期比其他不同，但与read_csv加载，日期将被明确定义。我已经尝试了连接命令，但它似乎并不保存日期。

df1 = df1.join(df2)

我得到一个有效的数据帧，但日期范围是固定的，以什么样的原始范围应给予日期两个csv文件之间的悬殊一些较小的子集。我想要的是创建一个包含NaN的2列（包含'A'列）的单个数据框或自动填入非重叠日期的零值的方法。有没有一个简单的解决方案，或者有什么我可能会在这里失踪。非常感谢。

来源

2014-05-12 Dae Il Kim

你想要什么叫外连接，并与'how'参数控制，参见[在文档（http://pandas.pydata.org/ pandas-docs/stable/merging.html） – alko

默认情况下，pandas DataFrame方法'join'使用'内部'合并组合两个数据框。你想使用'外部'合并。你加入行应为：

df1 = df1.join(df2, how='outer')

见http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.join.html

来源

2014-05-13 04:20:13 cgnorthcutt

谢谢你愿意解决这样一个新手问题！ –

结合2个数据帧和不同日期索引的大熊猫

回答

相关问题