文献分享 | 《ICML2020:基于样本效率的多智能体协同进化强化学习》
控制小组文献分享 ICML2020: 基于样本效率的多智能体协同进化强化学习摘要 许多多智能体协作强化学习场景为智能体提供了稀疏的基于团队目标的团队奖励,以及密集的基于单个智能体技能的个体奖励。团队奖励被用于激励智能体之间协作实现团队目标,而个体奖励被用于激励智能体学习基本的技能。通常,因为团队奖励是稀疏的,仅仅依靠它的训练策略是低效的,而仅仅依靠个体奖励的训练策略由于不能促进团队协调使得智能体容易陷入局部... […]
