2013-10-08 138 views
2

是否有在Vowpal Wabbit数据格式的例子指定多个标签的方法吗?多个标签

我试图逗号,并没有抱怨,但我不知道它做什么,我希望......

所以如:

2,3 | f1:3 f3:23 
2 | f1:2 f3:34 

第一行是一个例子无论是在2类和3类

我看到的vowpal mailing list一些讨论,但我不知道,因为如果有什么事情发生了。

Tom

+0

我们需要更多的细节。你在做一些多级比较吗? – Spaceghost

+0

嗨, 没有这个任务是非常简单的。我有30个类(他们是话题)。在培训材料(由文档组成)中,示例可以属于多个类(文档可以属于多个主题)。 所以我只是想知道我应该如何在VW格式的列车文件中反映这一点。 – Tom

回答

2

它看起来像你应该使用允许多个标签的CSOAA。它们需要是自然数并且小于或等于K,其中K是类的数量。就像这样:

1 2 3 class1 | f1:2 f2:3 
4 2 5 class2 | f3:7 f5:3 
2 3 class3 | f4:2 f2:2 

有关更多详细信息,请参阅Vowpal Wabbit文档:https://github.com/JohnLangford/vowpal_wabbit/wiki/Cost-Sensitive-One-Against-All-%28csoaa%29-multi-class-example

+0

太好了。非常感谢! – Tom

+0

解决了我原来的问题。 不过,我其实是在寻找一个多标记SVM(监守我想比较的SVM方法到别的我有)。 但是,CSOAA的文档说,你应该息事宁人的成本函数(所以没有“铰链”在这里,我猜)。 对此的任何想法.. ?? – Tom

+0

Sklearn(一个Python库)有多标签SVM .. – Spaceghost