我是机器学习的新手。我正在尝试使用MLlib的决策树。mllib的输入文件格式
有人可以帮助我如何为多类别分类准备mllib决策树的输入文件。
我的CSV文件的拥有
标签的格式,文字
label_1, text of label 1
label_2, text of label 2
label_3, text of label 3
通过mllib输入所需的格式是LIBSVM,或labeledpoint。
fileformat中没有允许的文本。问题是如何将文本映射到mllib所需的基于数字数据的文件格式,然后解释结果。我正在使用java来实现。
问候
你认为MLLib的TFIDF转换吗? – Anas 2014-10-10 08:14:45