没有训练价值的神经网络学习

我想知道如何去训练神经网络而不提供训练价值。我的前提是，神经网络将用于可以接收传感器正反馈的机器人。 IE，为了训练它自由漫游而不会碰到事物，当没有碰撞传感器或接近传感器被触发时，发生正反馈。当碰撞/接近传感器被触发时发生负反馈。如何使用这种方法训练神经网络？没有训练价值的神经网络学习

我在C++

来源

2012-01-25 BumbleShrimp

http://en.wikipedia.org/wiki/Temporal_difference_learning也许。我一直在使用这种算法的国际象棋。 – Damir

谢谢你，我正在阅读这篇论文：http：//remi.coulom.free.fr/Thesis/，结果你刚刚提到的是在这项技术中使用的。 – BumbleShrimp

@Damir你为什么不做出答案？ – BumbleShrimp

你描述的是所谓的强化学习。它可以应用于神经网络，但通常不需要它们。关于这个问题的标准教材是Richard Sutton和Andrew Barto的Reinforcement Learning: An Introduction。 James McClelland在PDP Handbook中更详细地探讨了神经网络与强化学习之间的关系。

来源

2012-01-26 00:01:17

写这个你已经采取了看看SLAM？这是一种机器人可以用来导航某个区域的技术，同时建立并保存该区域的地图。

来源

2012-01-25 21:45:44 phs

确实如此，我在本PDF中发现它：http://rossum.sourceforge.net/papers/Localization/PosPosterv4.pdf来自Rossum Project（http://rossum.sourceforge.net/），但感谢您链接，因为我没有详细阅读这个主题，不知道它被称为什么。 – BumbleShrimp

没有训练价值的神经网络学习

回答

相关问题