2010-04-03 85 views
5

创建libsvm培训文件时,如何区分名义属性和数字属性?我试图将某些名义属性编码为整数,但我想确保libsvm不会将它们误解为数字值。不幸的是,libsvm的网站似乎只有很少的文档。 Pentaho's docs似乎暗示libsvm会做出这样的区分,但我仍然不清楚它是如何制作的。LibSVM中的名义属性

回答

9

不要这样做I'm trying to encode certain nominal attributes as integers

而是对每个名义属性的每个值使用单独的二进制特征。

SVM的制定方式,所有属性/特征都是数字,类标签是名义上的。名义属性基本上是通过使用互斥二进制特征伪造的。

0

我想你不能在libsvm,weka或SVM-light中做到这一点。您可以使用的一种方法是对名义属性和svm使用决策树之类的东西,或者为数字属性使用基于距离的分类器,然后合并结果。我希望它有帮助。