import matplotlib.pyplot as plt
import pandas as pd
data = pd.DataFrame({ 'X': [1, 2, 3],
'Y': [4, 5, 6],
'A1': [1, None, 3],
'A2': [4, 5, 6],
'A3': ['Not', 'being', 'used'],
'A4': [None, 3, 3, None] })
_ = plt.figure()
_ = plt.hist([ data['A1'][pd.notnull(data['A1'])],
data['A2'][pd.notnull(data['A2'])],
data['A4'][pd.notnull(data['A4'])] ],
label=['A1', 'A2', 'A4'])
_ = plt.legend()
_ = plt.show()
有一些方法可以让我减少的plt.hist
第一个参数,在那里我一边喊pd.notnull(data['A1|2|3'])
删除数据集中的None
值的重复和冗长?熊猫:从多个列删除空值少冗长
编辑:看起来好像有重点放在绘图上,但我只是为了举例而使用它 - 我实际上想学习如何更好地处理这些数据帧。
这是你想要的东西:'data.filter(如= 'A')plot.hist()'? – MaxU
使用'data [['A1','A2','A4']]。plot.hist()'会将这些条放置在彼此之上(编辑例子引起此问题),而在上面的示例中使用matplotlib)酒吧是并排的,这在这种情况下是必要的。有没有办法使用'data [[''A1','A2','A4']]。plot.hist()'并排摆放酒吧?此外,我想实际知道如何更有效地删除这些空值以外的情况下,这样的帮助,将不胜感激。 –