我想在熊猫中绘制一些数据,并且内置的绘图功能方便地绘制每列一行。我想要做的是根据我所做的分类手动为每行分配一种颜色。指定大熊猫的线条颜色
以下工作:
df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=['1','2'])
df.plot(color = s)
但是,当我的指标是整数,它不再工作,并抛出为KeyError异常:
df = pd.DataFrame({1: [1, 2, 3, 4], 2: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,2])
df.plot(color = s)
我的理解是,当一个整数索引的使用方式它不知何故必须从0开始。这是我的猜测,因为以下的作品也是如此:
df = pd.DataFrame({0: [1, 2, 3, 4], 1: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,0])
df.plot(color = s)
我的问题是:
- 这里发生了什么事?
- 假设我有一个整数索引不是从0开始或者不是由连续数字组成的,我怎样才能使这项工作无需将索引转换为从0开始的字符串或重新索引?
编辑:
我意识到,即使是在第一种情况下,代码没有做什么,我希望它做的事。 似乎像大熊猫匹配DataFrame和Series的索引,只有两者都是从0开始的整数索引。如果不是这种情况,则抛出KeyError,或者如果索引是str,则使用元素的顺序。
这是正确的吗?有没有一种方法来匹配Series和DataFrame索引?或者我必须确保按照正确的顺序传递颜色列表?
您不希望索引匹配。您正在将Series索引与DataFrame的列进行匹配。 – thecircus