2017-06-30 51 views
1

修复我的输入形状问题后,我跑我的程序,问题是程序打印的总损失太高了(如果我比较它的快速入门教程)。蟒蛇TFlearn - 损失太高

我的目标是通过使用过去的数据(我有超过10M的条目与分数标记)预测未来入境拥堵,所以我不应该有培训问题。

这里是我的代码:

​​

我的Excel文件,有这种样子的(2列,100名000法分)

calculed_at , congestion 
1 , 56 
2 , 21 

这是结果会是什么样子(15划时代) :

Training samples: 50000 
Validation samples: 0 
.... 
-- 
Training Step: 40625 | total loss: 15.27961 | time: 17.659s 
| Adam | epoch: 013 | loss: 15.27961 - acc: 0.7070 -- iter: 50000/50000 
-- 
Training Step: 43750 | total loss: 15.66268 | time: 17.549s 
| Adam | epoch: 014 | loss: 15.66268 - acc: 0.7247 -- iter: 50000/50000 
-- 
Training Step: 46875 | total loss: 15.94696 | time: 18.037s 
| Adam | epoch: 015 | loss: 15.94696 - acc: 0.7581 -- iter: 50000/50000 
-- 

你知道什么会导致如此高的损失吗?这看起来很奇怪,因为印刷的精确度似乎不算太差。感谢您的帮助。

编辑:这似乎是,当我把论文的值,因为当我尝试刚才我总损失超过280(以下0,3或略高于精度)的好时机。

+0

你介意共享csv文件进行调试吗? –

+0

立即引起我的思考的是,这是一个完全线性的网络。如果你看看tflearn API,你的激活默认为'linear'。首先将其更改为非线性,然后查看它是否有效。 此外,由于这是一个回归,为什么你的损失'categorical_crossentropy'?详细阐述你的'data'和'labels'会有所帮助。 – jkschin

+0

@jkschin我不太习惯tflearn,我试过“softmax”而不是线性的,但并不是更好。对于categorical_crossentropy,我使用它是因为它在快速入门教程中,我不知道我应该选择哪一种。通过详细阐述数据和标签,你的意思是什么? –

回答

1

对于时间序列,您可以通过考虑时间窗的帧来构建输入/输出样本。在每个窗口中,如果样品是{0, 1, ...N},请选择第一个N-1样品作为输入,最后一个样品作为输出。然后你可以做回归来做time prediction