我想创建不同的df,一个用于两个变量的每个可能的组合(两个变量都有3个项目,所以组合为9)。循环根据变量的值拆分数据帧
每个df应根据变量的值命名,例如df_A_N。
这里我的意图,但我不能指定名称或推广到更多的变量:
df = pd.DataFrame({'v1': pd.Categorical(["A","A","AA","AAA"]),'v2': pd.Categorical(["N","N","W","E"])})
df
n = []
for i in df.v1:
if i not in n:
n.append(i)
print (n)
for i in n:
df_new=df[df.v1==i]
df_new
预期输出
df_new_A_N = pd.DataFrame({ 'V1' 的例子:pd.Categorical ([“A”]),'v2':pd.Categorical([“N”]))
df_new_A_W = pd.DataFrame({'v1':pd.Categorical([“A”]) 'v2':pd.Categorical([“W”]))
您可以添加预期的输出吗? –
在正文中完成,谢谢 – progster