2016-11-10 52 views
1

对于有监督的学习(如分类),将希望提高准确性的给定特征集添加新的可导出特征是一个好主意吗?我应该向特征向量添加可导出的特征吗?

例如: - 如果“unit_price”和“no_of_units”是两个给定的特征,是否有意义创建一个新的特征“amount”(unit_price * no_of_units)? - 如果“standard_deviation”是一个给定的特征,创建一个新的特征“variance”(它是standard_deviation^2)是一个好主意吗?

对此有理论指导,还是仅仅是一个试错的问题?

谢谢。

+0

欢迎来到SO!这不是一个编程问题,所以我会删除它并在[Cross Validated](http://stats.stackexchange.com/)上重新发布。 – Tchotchke

回答

0

恕我直言,是的,你可以添加像这样的新功能..看看SVM中的'内核',如果你有两个特征x和y,你可以添加特征xy。