2016-12-08 148 views
-2

这些代码是什么意思?机器学习udacity

你能向我解释:

features_train, labels_train, features_test, labels_test = makeTerrainData() 
def submitAccuracy(): 
    return acc 

回答

1

在机器学习中发展要将现有的数据拆分成火车/测试集,如果可能的附加验证集。你这样做是为了测试过度拟合,并确保你的模型可以概括为看不见的观察结果。最终的验证集通常是有用的,因为在不知道它的情况下,用户通常会试图根据测试分区的准确性来优化他们的参数,这样做基本上给了这些数据的模型提示。验证集有助于测试这没有发生,并且您的模型没有过度使用。

仅查看提供的代码,train_features可能对应于在列车分区中用于开发模型的实际数据。标签是您试图预测的类别。

测试分区只是您可用数据的随机样本。特征/标签与上述相同。

您想从训练数据中构建模型,并评估测试分区的准确性。

Sebastian Rascka提供了python中机器学习的绝妙概述。代码示例和一些解释可以在https://github.com/rasbt/python-machine-learning-book/tree/master/code