我读大熊猫文档来了解pandas.get_dummies独热编码器实现pandas.get_dummies,如何阅读语法
>>> import pandas as pd
>>> l = list('abca')
>>> print l
['a', 'b', 'c', 'a']
>>> s = pd.Series(l)
>>> print s
0 a
1 b
2 c
3 a
我创建了一个系列,如上图所示。
当我呼吁这个系列get_dummies,输出如下
>>> pd.get_dummies(s)
a b c
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0
是什么意思我不明白。
我们可以说这些条目的新值如下?
a --> 100
b --> 010
c --> 001
a --> 100
此外,他们是十进制还是二进制?
您正在回答你自己的问题。你真的想知道什么?是的,它创建了OneHotEncodings。 –
是的,我知道pandas.get_dummies创建一个热门的编码。我试图了解单热编码的功能。 – wasabi
希望链接将帮助https://datascience.stackexchange.com/questions/9443/when-to-use-one-hot-encoding-vs-labelencoder-vs-dictvectorizor – Wen