Improving Scalability for Multi-Agent Reinforcement Learning via Attention Parameter Sharing

Chao Li; Yanfei Liu; Zhong Lin Wang; Jieling Wang; Qi Tian

doi:10.1142/s230138502650055x

Abstract

1 min read

Scalability enhancement in Multi-agent Reinforcement Learning (MARL) is essential for tackling large-scale multi-agent challenges. Parameter sharing serves as an efficient mechanism to alleviate computational complexity during training, promoting improved learning efficiency and system stability. However, full parameter sharing often overlooks the differences between agents, leading to policy homogenization, slower convergence and difficulties in adapting to diverse decision-making tasks. In this paper, we propose a method called Attention Parameter Sharing (AtPS). AtPS incorporates multi-head self-attention into the value network, allowing agents to selectively focus on other agents with high similarity to themselves, which reduces model parameters while maintaining effective coordination. Moreover, we employ hierarchical clustering using the attention weights of each agent to form multi-agent groups, facilitating targeted parameter sharing within each group. Numerical results demonstrate that AtPS outperforms existing methods across various tasks in the six environments of SMAC, particularly in heterogeneous multi-agent scenarios. As the agent count grows, the performance gains of our method become increasingly evident, underscoring its effectiveness and practicality in scaling MARL.

Improving Scalability for Multi-Agent Reinforcement Learning via Attention Parameter Sharing

Abstract

Discussion(0)

Related publications

Efficient evolutionary curriculum learning for scalable multi-agent reinforcement learning

Attention-based Intrinsic Reward Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning

TPGCA: Transferable Policy Generation and Credit Assignment Network for Cooperative Multiagent Reinforcement Learning

MDDP: Making Decisions From Different Perspectives in Multiagent Reinforcement Learning

A Multi-Agent Reinforcement Learning Approach for Massive Access in NOMA-URLLC Networks

Related publications

Article2025
Efficient evolutionary curriculum learning for scalable multi-agent reinforcement learning
Article2025

Article2023
Attention-based Intrinsic Reward Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning
Article2023

Article2026
TPGCA: Transferable Policy Generation and Credit Assignment Network for Cooperative Multiagent Reinforcement Learning
Article2026

Article2023
MDDP: Making Decisions From Different Perspectives in Multiagent Reinforcement Learning
Article2023

Article2023
A Multi-Agent Reinforcement Learning Approach for Massive Access in NOMA-URLLC Networks
Article2023