1
所以我通过执行以下几行创建一个CountVectorizer对象。sklearn:使用CountVectorizer对象来获取新字符串的特征向量
count_vectorizer = CountVectorizer(binary='true')
data = count_vectorizer.fit_transform(data)
现在我有一个新的字符串,我想将这个字符串映射到我从CountVectorizer获得的TDM矩阵。 所以,我期待我输入到TDM的字符串是一个相应的文档术语向量。
我试过,
count_vectorizer.transform([string])
给了一个错误,AttributeError的:变换找不到 添加堆栈跟踪,它是一个很长的堆栈跟踪,因此我只需添加相关的位,而这最后几行的AA部分的痕迹。
File "/Users/ankit/Desktop/geny/APIServer/RUNTIME/src/controller/sentiment/Sentiment.py", line 29, in computeSentiment
vec = self.models[model_name]["vectorizer"].transform([string])
File "/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/scipy/sparse/base.py", line 440, in __getattr__
raise AttributeError(attr + " not found")
请指教。
感谢
ANKIT小号
Aditya,感谢您的评论。根据您的建议添加堆栈跟踪。这里的矢量化器使用Pickle写入一个文件,然后我再次加载它。我想知道是否会导致错误。我检查一样会保持你的发布。它奇怪的如何简单的函数调用不能工作! –