2016-04-07 53 views
1

所以我被告知,对于监督式学习或分类算法,训练和测试的输入数据也包括标签(或目标)。有监督机器学习的历史标签

所以我有这个非常混乱的想法,标签来自哪里,人们手动标记记录?可能是一个非常庞大的训练和测试数据集,如果有一个“程序”或方法自动标记记录,那么这意味着对于未来的数据,我们也可以拥有标签?那么为什么要预测呢?

也许我想念一些东西......任何人都可以帮助我一个真实世界的例子吗?就像信用欺诈和非欺诈一样,银行工作人员可能会将帐户标记为欺诈或非欺诈行为,或者如果他们有一个“公式”来表明欺诈,那么“公式”应该一直使用银行,主管学习在哪里发挥作用?

+0

'人们手动标记记录?' - 是的。你没有错过任何东西 - 这完全是正确的想法。另一种可能性是,他们对少数情况进行了非常昂贵的实验,然后预测其他情况,因为测量所有成本太昂贵。 – cel

+0

嗯,所以应用监督式学习的场景会如何如下:这个数据集没有标签,然后手动将标签应用于选定的子集,或者可能是整套数据,但是这是太多的劳动和人类参与,现在我们想要一个解决方案,在未来的计算机可以为我们做的事情? – vcharlie

回答

0

监督学习的重点恰恰是猜测标签是什么。

因此,在您的信用卡诈骗案件中,人们确实已经手动将案件标记为欺诈或不公开。与ML的想法是,你可以猜测,鉴于人们已经提出了什么标签,如果他们看到未来的数据,他们会想出什么。