我正在处理数字数据集,显然它是一个多变量输出回归。我想知道您是否可以在数字数据集中使用多标签分类,或者仅限于基于文本的分类。是仅用于文本的多标签分类
例如:Stackoverflow将每个文本/代码分类为多个标签,如python,flask, python2.7
......但是可以用数字来完成这样的事情。对不起,我知道这是一个noob问题,但我想知道答案。提前致谢。
我正在处理数字数据集,显然它是一个多变量输出回归。我想知道您是否可以在数字数据集中使用多标签分类,或者仅限于基于文本的分类。是仅用于文本的多标签分类
例如:Stackoverflow将每个文本/代码分类为多个标签,如python,flask, python2.7
......但是可以用数字来完成这样的事情。对不起,我知道这是一个noob问题,但我想知道答案。提前致谢。
当然可以用数字来完成。毕竟,文本本身被转换为数字进行分类。但是你不应该为此使用回归。分类显然是一种情况。
常规分类器(例如,神经网络)通常具有多个输出,每个类都有一个输出。每个输出都返回输入向量属于该特定类的概率。
在标准分类中,可以用最大概率将其分配给类别。在你的情况下,只是将它分配给所有类别p > 0.5
(假设输出是[0, 1]
,
关于你的问题是多回归问题还是多分类问题,你无法知道如果您试图在连续范围内查找数值(例如,预测给定产品的价格和销售数量),请选择回归, 。如果你有一些输入有或没有的属性,请选择分类。
你是否认为每个SO问题都映射到一个唯一的数字? – Goyo