2017-10-09 28 views
-1

我正在处理数字数据集,显然它是一个多变量输出回归。我想知道您是否可以在数字数据集中使用多标签分类,或者仅限于基于文本的分类。是仅用于文本的多标签分类

例如:Stackoverflow将每个文本/代码分类为多个标签,如python,flask, python2.7 ......但是可以用数字来完成这样的事情。对不起,我知道这是一个noob问题,但我想知道答案。提前致谢。

+0

你是否认为每个SO问题都映射到一个唯一的数字? – Goyo

回答

1

当然可以用数字来完成。毕竟,文本本身被转换为数字进行分类。但是你不应该为此使用回归。分类显然是一种情况。

常规分类器(例如,神经网络)通常具有多个输出,每个类都有一个输出。每个输出都返回输入向量属于该特定类的概率。

在标准分类中,可以用最大概率将其分配给类别。在你的情况下,只是将它分配给所有类别p > 0.5(假设输出是[0, 1],

关于你的问题是多回归问题还是多分类问题,你无法知道如果您试图在连续范围内查找数值(例如,预测给定产品的价格和销售数量),请选择回归, 。如果你有一些输入有或没有的属性,请选择分类。

+0

谢谢你,我想知道你怎么能看一个数字问题,并知道如果这是一个多回归或多标签问题。我很抱歉要求noob q's,但我得问:) – jason

+0

@jason:编辑。总之,如果数据集中的输出是连续的,那么就有回归。如果它们是离散的(只有整数值)或文本,你有分类。 –

+0

明白了! 。谢谢。如果我有更多疑问,我可以与您取得联系吗?顺便说一句,多标签和多分类是两种不同的东西吧? – jason