是仅用于文本的多标签分类

-1

我正在处理数字数据集，显然它是一个多变量输出回归。我想知道您是否可以在数字数据集中使用多标签分类，或者仅限于基于文本的分类。是仅用于文本的多标签分类

例如：Stackoverflow将每个文本/代码分类为多个标签，如python,flask, python2.7 ......但是可以用数字来完成这样的事情。对不起，我知道这是一个noob问题，但我想知道答案。提前致谢。

2017-10-09 jason

你是否认为每个SO问题都映射到一个唯一的数字？ – Goyo

当然可以用数字来完成。毕竟，文本本身被转换为数字进行分类。但是你不应该为此使用回归。分类显然是一种情况。

常规分类器（例如，神经网络）通常具有多个输出，每个类都有一个输出。每个输出都返回输入向量属于该特定类的概率。

在标准分类中，可以用最大概率将其分配给类别。在你的情况下，只是将它分配给所有类别p > 0.5（假设输出是[0, 1],

关于你的问题是多回归问题还是多分类问题，你无法知道如果您试图在连续范围内查找数值（例如，预测给定产品的价格和销售数量），请选择回归，。如果你有一些输入有或没有的属性，请选择分类。

2017-10-09 12:19:53

谢谢你，我想知道你怎么能看一个数字问题，并知道如果这是一个多回归或多标签问题。我很抱歉要求noob q's，但我得问:) – jason

@jason：编辑。总之，如果数据集中的输出是连续的，那么就有回归。如果它们是离散的（只有整数值）或文本，你有分类。 –

明白了！。谢谢。如果我有更多疑问，我可以与您取得联系吗？顺便说一句，多标签和多分类是两种不同的东西吧？ – jason

回答