2017-07-28 69 views
1
的总

假设我有一些楠数据框 -熊猫 - 更换楠非空值

import pandas as pd 
l = [{'C1':-6,'C3':2}, 
    {'C2':-6,'C3':3}, 
    {'C1':-6.3,'C2':8,'C3':9}, 
    {'C2':-7}] 
df1 = pd.DataFrame(l, 
    index=['R1','R2','R3','R4']) 
print(df1) 

    C1 C2 C3 
R1 -6.0 NaN 2.0 
R2 NaN -6.0 3.0 
R3 -6.3 8.0 9.0 
R4 NaN -7.0 NaN 

问题 -如果有任何行单元格中的任何NaN的值,那么它必须被替换通过来自同一行的非空值的聚合。 例如,在第一行中,(R1,C2)的值应为=(-6 + 2)/ 2 = -2

预期输出 -

 C1 C2 C3 
R1 -6.0 -4.0 2.0 
R2 -1.5 -6.0 3.0 
R3 -6.3 8.0 9.0 
R4 -7.0 -7.0 -7.0 

回答

3

使用applyaxis=1过程按行:

df1 = df1.apply(lambda x: x.fillna(x.mean()), axis=1) 
print(df1) 

    C1 C2 C3 
R1 -6.0 -2.0 2.0 
R2 -1.5 -6.0 3.0 
R3 -6.3 8.0 9.0 
R4 -7.0 -7.0 -7.0 

也可以工作:

df1 = df1.T.fillna(df1.mean(1)).T 
print(df1) 
    C1 C2 C3 
R1 -6.0 -2.0 2.0 
R2 -1.5 -6.0 3.0 
R3 -6.3 8.0 9.0 
R4 -7.0 -7.0 -7.0 

因为:

df1 = df1.fillna(df1.mean(1), axis=1) 
print(df1) 

NotImplementedError: Currently only can fill with dict/Series column by column

+1

感谢您指向应用功能。 – dataLeo

+1

非常好的解决方案。 – Dark

0

你能做到这一点。转置,然后做fillna()然后再转置它。

>>> df1 = df1.T.fillna(df1.mean(axis=1)).T 
>>> print(df1) 
    C1 C2 C3 
R1 -6.0 -4.0 2.0 
R2 -1.5 -6.0 3.0 
R3 -6.3 8.0 9.0 
R4 -7.0 -7.0 -7.0