%0 Journal Article
%T 基于可分解mdp模型的mas协作策略优化及分布执行
%A 王晓伶 慕德俊 刘哲元 袁源？
%J 计算机科学
%D 2009
%X 不确定环境下mas生成协作策略的复杂度关系到协作任务能否成功实现。为降低马尔可夫决策模型生成mas协作策略的复杂度，减少协作通信量，改进了可分解mdp模型生成策略树的方法。利用bayesian网络中agent状态之间存在的条件独立性与上下文独立性，分解并优化spi算法生成的策略树，使得mas中处于独立状态的agent可以分布独立运行，只有在需要同其他agent协商时才进行通信。通信时采用端对端的方式，agent不仅知道协商内容、协商时机，而且知道协作的目标。实验表明，采用该协作策略mas在完成协作任务获得
%K 多智能体系统可分解马尔可夫决策过程贝叶斯网络上下文独立条件独立
%U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=29209278&flag=1