|
- 2019
基于手牌拆分的“斗地主”蒙特卡洛树搜索DOI: 10.3969/j.issn.1001-4616.2019.03.014 Keywords: 斗地主,计算机博弈,强化学习,蒙特卡洛树搜索 Abstract: “斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具. 本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题; 其次,通过蒙特卡洛抽样法,对“斗地主”非完全合作博弈进行不断抽样模拟,在满足一定预设条件后,选择收益最佳的节点作为本次最佳决策. 实验结果表明,基于手牌拆分的“斗地主”蒙特卡洛树搜索能较好地实现“斗地主”自动博弈
|