当使用scikit学习或其他类似的Python库,有什么做的区别: import sklearn.cluster as sk
model = sk.KMeans(n_clusters=n)
而且 from sklearn.cluster import KMeans
model = KMeans(n_clusters=n)
是否有任何优势,使用一种方法比其他?
我想将某些文本向量化为相应的整数,然后将这些文本转换为其映射的整数,并使用新的输入整数[2,9,39,46,56,12,89,9]创建新句子。 我见过一些可以用于此目的的自定义函数,但我想知道sklearn本身是否具有这样的功能。 from sklearn.feature_extraction.text import CountVectorizer
a=["""Lorem ipsum dolo
我想向量化一些分类数据以构建列车和测试矩阵。 我有85个城市,我想获得一个矩阵282520行,每一行是像 [1 0 0 ..., 0 0 0]
矢量我想有每行的矢量为1或0取决于城市,所以每因此城市应该是一个列: print(df['city'])
0 METROPOLITANA DE SANTIAGO
1 METROPOLITANA DE SANTIAGO
2 METRO