2017-04-05 17 views

回答

0

是的,RapidMiner中有一个k-Means运算符,甚至包括一些额外的变体,如k-Means,内核和X-means。 要处理文本文件,您可以使用RapidMiner市场上提供的文本处理扩展。

最好的参数设置取决于您的数据,但您尝试不同的设置。一种方法是将k-means运算符放入“优化参数”中,可以使用群集性能运算符之一或通过自定义性能度量来评估性能。

+0

感谢您的帮助...我可以使用任何操作员只保留英文单词并删除任何其他语言中的任何单词吗? – faris

+0

到目前为止我还没有做过这个。可能会很棘手,因为词干可能是相似的。您可以尝试RapidMiner市场上的[Aylien文本分析扩展](https://marketplace.rapidminer.com/UpdateServer/faces/product_details.xhtml?productId=rmx_com.aylien.textapi.rapidminer),它具有语言检测支持 - – David

相关问题