我是机器学习的新手。我目前想要的是分类是否某些单词是否属于某一类别。使用机器学习算法的词分类
让我更具体一些,输入一些单词时,我需要检查这些单词是否属于“马拉雅拉姆语”。
例如:enthayi ninakk sugamanno?
这些是用英语表达的一些马拉雅拉姆语单词。在给出这样的输入时,需要检查训练的数据,并且如果有任何输入单词属于“马拉雅拉姆语”类别,则需要显示它是马拉雅拉姆语。
我已经尝试做..
我试着将它与NaiveBayesClassifier分类,但它总是显示了所有输入数据的积极响应。
train = [
('aliya','Malayalam')]
cl = NaiveBayesClassifier(train)
print cl.classify('enthayi ninakk sugamanno')
但打印语句使输出“马拉雅拉姆语”
我刚刚添加了一些替代方案,但实际上系统显示的输出与Malayalam相同,即使输入数据不同。 –
我建议你阅读文档。你没有正确初始化你的分类器,我很惊讶它甚至运行。你应该不加参数地创建它('cl = NaiveBayesClassifier()'),然后用'cl.train(data)'以*适当*格式的数据进行训练。你在哪里看到你正在使用的设置? – alexis
http://stevenloria.com/how-to-build-a-text-classification-system-with-python-and-textblob/ 从这里我得到的语法... –