蒙特卡洛树搜索：双人游戏的树策略

我对如何实施MCTS“树策略”有点困惑。我读过的每篇论文或文章都会谈到从目前的游戏状态（在MCTS teminology中：玩家即将采取行动的根源）进入树状结构。我的问题是我如何选择最好的孩子，即使我在MIN玩家级别（假设我是MAX玩家）。即使我选择MIN可能采取的一些特定动作，并且我的搜索树在该节点中的深度也会更大，但MIN玩家在选择其他节点时可能会选择不同的节点（如果min玩家是业余人员，以及选择一些不一定最好的节点）。由于MIN选择了不同的节点，所以这种做法使得MAX的整个工作通过该节点无效传播。对于我所指的步骤： https://jeffbradberry.com/posts/2015/09/intro-to-monte-carlo-tree-search/ 其中的树策略：https://jeffbradberry.com/images/mcts_selection.png 种类让我相信他们正在从单一玩家的角度来执行它。蒙特卡洛树搜索：双人游戏的树策略

来源

2017-02-17 Avisek Naug

我;在问题中没有看到任何Python。 –

剥削性游戏需要对手建模。对于大多数游戏来说，假设对手玩得最好就足够了。扑克可能是一个例外。 –

对不起，彼得的标签！我是新手，我主要使用python编写代码。现在我意识到这是无关紧要的。 –