0

Conveyor layout. A and B entry points and C and D exit points. There is a crossroad at position X如何用神经网络实现寻路和拥塞检测?

这是一个传送带系统。箱子在A处进入系统并朝C离开系统。对于B-> D也是如此。

路径A-> C上的框比框B-> D具有更高的优先级。盒子可以在每个广场停下来等待。如果在A2和B2上有一个框,则A2中的一个应该先经过X.

如果在C2,C1,A2和B2上有框,那么B2中的框应该穿过X并在A2框上等待,直到C1为空。否则它会阻塞路径B-> D。

如何用神经网络解决这个问题? 因此,我想输入每个块的当前状态,因此我想从哪里到哪里下一个盒子应该移动。

例如: 系统状态:存在于A1BOX 结果:A1,A2

我不知道,如果神经网络是此问题的一个很好的工具,但我只是好奇。 感谢您的输入:)

回答

1

你在找什么是一个政策,映射到行动。

虽然您可以使用神经网络来存储您的策略,但您需要某种方式与环境进行交互以收集数据。

你所描述的是一个典型的强化学习问题。我建议你看看Q-learning。对于状态空间的大小,可以很容易地将您的策略​​存储在表中,但是如果需要,神经网络也很容易与Q学习相结合(尽管在使用非线性逼近方案时不能保证收敛)。