如何用神经网络实现寻路和拥塞检测？

这是一个传送带系统。箱子在A处进入系统并朝C离开系统。对于B-> D也是如此。

路径A-> C上的框比框B-> D具有更高的优先级。盒子可以在每个广场停下来等待。如果在A2和B2上有一个框，则A2中的一个应该先经过X.

如果在C2，C1，A2和B2上有框，那么B2中的框应该穿过X并在A2框上等待，直到C1为空。否则它会阻塞路径B-> D。

如何用神经网络解决这个问题？ 因此，我想输入每个块的当前状态，因此我想从哪里到哪里下一个盒子应该移动。

例如：系统状态：存在于A1BOX 结果：A1，A2

我不知道，如果神经网络是此问题的一个很好的工具，但我只是好奇。感谢您的输入:)

你在找什么是一个政策，映射到行动。

虽然您可以使用神经网络来存储您的策略，但您需要某种方式与环境进行交互以收集数据。

你所描述的是一个典型的强化学习问题。我建议你看看Q-learning。对于状态空间的大小，可以很容易地将您的策略存储在表中，但是如果需要，神经网络也很容易与Q学习相结合（尽管在使用非线性逼近方案时不能保证收敛）。

2016-02-26 12:05:27 purpletentacle

回答