2017-08-14 96 views
2

使用标准化我很想知道的是,在R A H2O模型中使用标准化功能时攻入了新的数据时,它是如何工作的。当H2O新的数据

我知道,当它进行标准化的训练集是基于均值和训练数据的标准差设置均值为0,标准差为1,但又有什么用新的数据呢?

是否规范基于训练数据的平均值和标准偏差或者它规范基础上,新的数据被拿下?

回答

0

的得分函数应用于用于训练数据标准化至测试数据集相同的映射。这由H2O自动处理。

+0

感谢艾琳,这是我的猜测,否则系数不会像解释。我想我只需要留意每个功能,这样他们就不会有太多的加班。你也知道是否有函数会为我抽取这些映射吗?即均值和用来规范各功能还是我只写一个函数,它是对原始数据...平均值(x)和SD(x)的标准偏差。基本上我想将模型更接近我的数据库中的数据,并使用sql手动为模型编写函数。 –

+0

不,这些方法不会通过H2O客户端API(我知道)公开。您可以关闭此功能并手动执行操作(请参阅GLM & DL;中的标准化参数,其他参数不会影响功能),但如果您要使用H2O进行建模,最容易让H2O处理这自动。 –

+0

我后来发现h2o同时产生标准化系数和非标准化系数。非标准化的数据可以用于非标准化的数据! –