2017-04-01 53 views
1

在机器学习中,如何处理薪水等功能。例如,如果我通过测量基于特征的数据点之间的距离来应用k最近的邻居。假设我们有两点薪水为2000和6000.他们之间的差异是4000.让我们再看两点薪水为102000和106000.这里的差异仍然是4000美元,但我们人类认为最后两个点更接近或更相似前两点。在不同范围内具有不同含义的功能

如何在机器学习中融入这种直觉?

+0

标准化和规范我的朋友 –

回答

1

你可以做以下的事情之一(还有更多):

  • 使用日志功能(因此2000和6000将远远超出102000和106000)
  • 二值化特征变换特征为多个桶(你将创造薪水每个范围内的功能,你是一个创造桶)的K-NN
  • 变化相似的功能相对于看差的绝对值,而不是
相关问题