我使用tensorflow 1.0来培训DNNRegressor。大多数培训已经由新的tensorflow 1.0功能自动处理。型号信息自动保存在文件夹中。我使用for循环重复地使用不同的训练文件调用train(filepath,isAuthentic)函数。Tensorflow 1.0培训模式使用指数级更多的空间
问题是events.out.tfevents文件越来越大,占用空间。我已经通过在生成这些文件时删除这些文件来解决这个问题,但是CPU仍然会在尝试生成这些文件时增加更多的时间浪费。这些不会影响培训或预测的结果。有没有办法阻止这些events.out.tfevents文件被生成?
我注意到,当我长时间运行python程序时,events.out.tfevents文件大小开始很小,然后变大,但是如果我运行几个较短间隔期的训练,则文件尺寸保持不变。
picture of model folder, contents ordered by size
当我让跑步训练足够长的时间,在events.out.tfevents达到了200 MB,浪费了太多的时间和空间。我已经尝试更改传递给DNNRegressor的RunConfig对象中的检查点和汇总参数。
def getRegressor():
feature_cols = [tf.contrib.layers.real_valued_column(k) for k in networkSetup.FEATURES]
# Build 2 layer fully connected DNN with 8, 8 units respectively.
regressor = tf.contrib.learn.DNNRegressor(feature_columns=feature_cols,
hidden_units=[8, 8],
model_dir=networkSetup.MODEL_DIR,
activation_fn=tf.nn.sigmoid,
optimizer=tf.train.GradientDescentOptimizer(
learning_rate=0.001
)
)
return regressor
def train(filepath, isAuthentic):
regressor = getRegressor()
# training on training set
regressor.fit(input_fn=lambda: input_fn(filepath, isAuthentic), steps=1)