2017-01-16 57 views
0

我有一个数据框有多个列。我想遍历列,计算每列有多少空值,并生成一个新的数据框,它显示列标题名称旁边的isnull值的总和。熊猫isnull与列标题总和

如果我做的:

for col in main_df: 
    print(sum(pd.isnull(data[col]))) 

我得到的每个列的空计数的列表:

0 
1 
100 

我试图做的是创建具有列一个新的数据帧标题与无效计数一起,例如

col1 | 0 
col2 | 1 
col3 | 100 
+0

欺骗:http://stackoverflow.com /问题/ 26266362 /如何对计数的楠值-内式列在熊猫数据帧 – EdChum

回答

0

试试这个:

In [71]: df 
Out[71]: 
    a b c 
0 NaN 7.0 0 
1 0.0 NaN 4 
2 2.0 NaN 4 
3 1.0 7.0 0 
4 1.0 3.0 9 
5 7.0 4.0 9 
6 2.0 6.0 9 
7 9.0 6.0 4 
8 3.0 0.0 9 
9 9.0 0.0 1 

In [72]: pd.isnull(df).sum() 
Out[72]: 
a 1 
b 2 
c 0 
dtype: int64 

或:

In [76]: df.isnull().sum() 
Out[76]: 
a 1 
b 2 
c 0 
dtype: int64 

,你可以在它外面创建一个DF:

In [78]: df.isnull().sum().to_frame('nulls') 
Out[78]: 
    nulls 
a  1 
b  2 
c  0