有监督机器学习的历史标签

所以我被告知，对于监督式学习或分类算法，训练和测试的输入数据也包括标签（或目标）。有监督机器学习的历史标签

所以我有这个非常混乱的想法，标签来自哪里，人们手动标记记录？可能是一个非常庞大的训练和测试数据集，如果有一个“程序”或方法自动标记记录，那么这意味着对于未来的数据，我们也可以拥有标签？那么为什么要预测呢？

也许我想念一些东西......任何人都可以帮助我一个真实世界的例子吗？就像信用欺诈和非欺诈一样，银行工作人员可能会将帐户标记为欺诈或非欺诈行为，或者如果他们有一个“公式”来表明欺诈，那么“公式”应该一直使用银行，主管学习在哪里发挥作用？

2016-04-07 vcharlie

'人们手动标记记录？' - 是的。你没有错过任何东西 - 这完全是正确的想法。另一种可能性是，他们对少数情况进行了非常昂贵的实验，然后预测其他情况，因为测量所有成本太昂贵。 – cel

嗯，所以应用监督式学习的场景会如何如下：这个数据集没有标签，然后手动将标签应用于选定的子集，或者可能是整套数据，但是这是太多的劳动和人类参与，现在我们想要一个解决方案，在未来的计算机可以为我们做的事情？ – vcharlie

监督学习的重点恰恰是猜测标签是什么。

因此，在您的信用卡诈骗案件中，人们确实已经手动将案件标记为欺诈或不公开。与ML的想法是，你可以猜测，鉴于人们已经提出了什么标签，如果他们看到未来的数据，他们会想出什么。

2016-04-07 14:08:50 Carlos

回答