2

我想知道如何去训练神经网络而不提供训练价值。我的前提是,神经网络将用于可以接收传感器正反馈的机器人。 IE,为了训练它自由漫游而不会碰到事物,当没有碰撞传感器或接近传感器被触发时,发生正反馈。当碰撞/接近传感器被触发时发生负反馈。如何使用这种方法训练神经网络?没有训练价值的神经网络学习

我在C++

+0

http://en.wikipedia.org/wiki/Temporal_difference_learning也许。我一直在使用这种算法的国际象棋。 – Damir

+0

谢谢你,我正在阅读这篇论文:http://remi.coulom.free.fr/Thesis/,结果你刚刚提到的是在这项技术中使用的。 – BumbleShrimp

+0

@Damir你为什么不做出答案? – BumbleShrimp

回答

5

你描述的是所谓的强化学习。它可以应用于神经网络,但通常不需要它们。关于这个问题的标准教材是Richard Sutton和Andrew Barto的Reinforcement Learning: An Introduction。 James McClelland在PDP Handbook中更详细地探讨了神经网络与强化学习之间的关系。

1

写这个你已经采取了看看SLAM?这是一种机器人可以用来导航某个区域的技术,同时建立并保存该区域的地图。

+0

确实如此,我在本PDF中发现它:http://rossum.sourceforge.net/papers/Localization/PosPosterv4.pdf来自Rossum Project(http://rossum.sourceforge.net/),但感谢您链接,因为我没有详细阅读这个主题,不知道它被称为什么。 – BumbleShrimp