2014-03-03 37 views
1

有没有一种方法来估计拟合模型的剩余时间?例如scikit-learn合适的剩余时间

model = sk.ensemble.RandomForestRegressor(n_estimators=10) 
model.fit(x, y) 

我有一个非常大的数据集(百万行),这将需要一些时间,所以我想知道估计时间,所以我可以做其他的thigngs并取回当过程结束。

像随机森林估计剩余时间的合奏应该[合理]容易。

回答

6

尝试verbose选项。您可以从0(无输出),1(更新每个作业)和2(更新每棵树)

model = RandomForestRegressor(n_estimators=100, verbose=2, n_jobs=2).fit(X_train, y_train) 
+0

谢谢!这几乎就是我正在寻找的东西!太糟糕了,仅在每项工作完成后才会打印时间估计。在每棵树建成之后有没有办法打印估计值? – mikkom

+0

据我所知,我不认为它可以给你时间估计,因为每个人的机器都有不同的速度。但是,如果您知道创建一棵树需要多长时间,那么您可以很好地估计创建所有树木的时间。您可以直接在他们的邮件列表中询问,或者在他们的GitHub页面https://github.com/scikit-learn/scikit-learn中提出一个新功能。 – ysakamoto

+0

谢谢,我想我会那样做的。我自己为Weka创建了类似的时间估算(计算平均树创建时间并将其投影到未创建的树上),并且多线程库已经在最后打印时间估计,这应该非常容易。 – mikkom