我遇到了this example,其中涉及完成测试数据集的面部。这里,max_features
的值32
传递给ExtraTreesRegressor()
函数。我了解到构建的决策树会从输入数据集中选择随机特征。对于上述链接的示例,图像用作列车和测试数据集。 This wiki page描述了各种类型的图像特征。现在我无法了解哪些功能剂量sklearn.ensemble.ExtraTreeRegressor
寻找或提取作为输入提供的图像数据集来构建随机森林。另外,如何确定32
的值对于max_features
是最佳值。请帮我解决一下这个。Scikit的ExtraTreeRegressor考虑的功能学习构建随机森林
0
A
回答
5
随机森林不做特征提取。他们使用给定的数据集中的特征,在这个例子中,这些特征只是来自Olivetti faces数据集的像素强度。
max_features
参数为ExtraTreesRegressor
决定了“查找最佳拆分时要考虑的功能数量”(在森林使用的decision tree learning algorithm内)。
值32可能是凭经验确定的。
5
这里使用的特征是原始像素值。由于数据集中的图像是一致的,而且非常相似,这似乎足以完成任务。
2
正如其他人所说:在这个朴素的例子中没有特征提取:额外的树只是使用原始像素作为特征。
在更真实的计算机视觉设置中,执行手动调整特征提取很可能会导致更有趣的模型。要提取的功能类型取决于您要实现的计算机视觉任务。阅读OpenCV库中的文献或示例以了解计算机视觉领域的最新技术(将神经网络表示学习放在一边,作为现在的最新研究成果)。
该参数的32值可以随机搜索。以主分支中的示例为例:
http://scikit-learn.org/dev/auto_examples/randomized_search.html#example-randomized-search-py
相关问题
- 1. Python的 - 与scikit错误学习随机森林约值格式
- 2. scikit学习随机森林的概率分布?
- 3. scikit随机森林学习.9或更低
- 4. 随机森林 - 概率估计(+ scikit学习具体)
- 5. Scikit学习 - 随机森林:如何处理连续特征?
- 6. 平行随机森林scikit学习抛出一个异常
- 7. 监督学习随机森林通过
- 8. scikit-learn中的随机森林解释
- 9. scikit-learn随机森林的输入
- 10. scikit随机森林的使用sample_weights
- 11. Python Scikit随机森林回归错误
- 12. 随机森林:查找相关功能
- 13. LGPL机器学习与随机森林 - C++
- 14. 随机森林机器学习支持字符串字符吗?
- 15. 如何解释sci-kit随机森林分类器的学习?
- 16. 如何SciKit学习随机森林子样本量可能等于原始训练数据的大小?
- 17. ROC随机森林
- 18. python中的随机森林
- 19. 随机森林中的R
- 20. SciKit-Learn:使用随机森林时的JoblibException
- 21. 随机森林(scikit-learn)中的bootstraps数量
- 22. 使用Scikit-Learn为Python中的随机森林绘图树
- 23. 在scikit-learn中使用随机森林时的feature_importances_
- 24. Scikit学习中的随机状态(伪随机数)
- 25. Scikit的学习随机森林分类器中是否有内置方法来计算精度?
- 26. 具有自定义丢失功能的随机森林
- 27. 具有比数据点更多功能的随机森林
- 28. Spark随机森林错误
- 29. 随机森林,使用R
- 30. P值为随机森林