我想知道是否有一种考虑的方法可以排除所有多于的列N NaN,从该子集中排除一列。具有> N个NaN的滴列不包括特定列
例如:
df = pd.DataFrame([[np.nan, 2, np.nan, 0],
[3, 4, np.nan, 1],
[np.nan, np.nan, np.nan, 5]],
columns=list('ABCD'))
结果:
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 5
运行下面,我得到:
df.dropna(thresh=2, axis=1)
B D
0 2.0 0
1 4.0 1
2 NaN 5
我想继续列 'C'。即,除了在'C'列之外执行这个阈值。
这可能吗?
'df.isnull()。所有(0)'代替'df.isnull()。总和(0)== LEN(DF)'? – Zero
@零增加,:) – Wen
这是不正确的 - 它只适用于这个例子,因为C是唯一具有所有'NaN'的列。这将保留任何具有所有'NaN'的列,而不一定是C列(如果C没有全部'NaN')。 –