Skip to content

语言模型智能体中的超加性合作

原标题: Super-additive Cooperation in Language Model Agents 作者: Filippo Tonini, Lukas Galke (南丹麦大学) 发表: arXiv 预印本, 2025年 链接: arXiv:2508.15510领域: 合作博弈、多智能体系统、进化心理学


一句话总结

这篇论文发现,当 LLM 智能体同时面临"团队内合作"和"团队间竞争"时,会产生"超加性效应"——合作率显著高于单独任一条件,这与人类社会中"共同敌人促进内部团结"的现象高度一致。


研究背景

超加性合作理论

在人类社会中,存在一个有趣的现象:

┌─────────────────────────────────────────────────────────────┐
│              超加性合作 (Super-additive Cooperation)         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   单独重复互动 (RI)  →  合作率: A%                          │
│   单独群体竞争 (GC)  →  合作率: B%                          │
│   两者结合 (SA)      →  合作率: >> A% + B%  ✨              │
│                                                             │
│   关键洞察: 1 + 1 > 2                                       │
└─────────────────────────────────────────────────────────────┘

💡 通俗理解: 想象两个部门之间的竞争——当你的部门需要与另一个部门竞争时,部门内部的合作往往会空前团结。这就是"超加性"——外部威胁强化了内部凝聚力。

两种促进合作的机制

机制英文作用原理
重复互动Repeated Interactions (RI)未来的"影子"促使合作——"我们以后还会见面"
群体竞争Group Competition (GC)共同敌人促进团结——"我们要赢过他们"

实验设计

锦标赛结构

研究者设计了一个虚拟锦标赛,LLM 智能体被分成团队进行囚徒困境博弈:

┌─────────────────────────────────────────────────────────────┐
│                     实验设置                                 │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   团队 A          vs          团队 B                        │
│  ┌─────┐                     ┌─────┐                        │
│  │ a1  │  ←  内部博弈  →     │ b1  │                        │
│  │ a2  │                     │ b2  │                        │
│  │ a3  │                     │ b3  │                        │
│  └─────┘                     └─────┘                        │
│                                                             │
│   内部: 团队成员间的囚徒困境                                  │
│   外部: 团队间的资源竞争                                      │
└─────────────────────────────────────────────────────────────┘

三种实验条件

条件缩写设置
重复互动RI多轮博弈,无团队竞争
群体竞争GC团队竞争,单轮博弈
超加性SA多轮博弈 + 团队竞争

测试模型

  • Qwen3: 阿里巴巴开源模型
  • Phi4: 微软小型语言模型
  • Cogito: 新型推理模型

智能体决策流程

每个智能体使用"规划-评估"循环:

python
# 概念示例:智能体决策流程
def agent_decision(context, history):
    # 阶段 1: 规划
    plan = think_about_strategy(context)

    # 阶段 2: 评估当前局势
    evaluation = assess_situation(history)

    # 阶段 3: 做出决策
    action = decide(plan, evaluation)  # COOPERATE 或 DEFECT

    return action

实验结果

合作率对比

模型RI (仅重复)GC (仅竞争)SA (超加性)
Phi421%13%43%
Qwen3~25%~15%~45%
Cogito中等显著提升

关键发现 1:超加性效应存在

          合作率
    50% │         ★ SA
        │        ╱
    40% │       ╱
        │      ╱
    30% │     ╱
        │    ╱
    20% │ ──●── RI

    10% │ ──○── GC

     0% └─────────────────────
          条件

SA 条件下的合作率远超 RI 和 GC 单独之和,证明了超加性效应的存在。

关键发现 2:一次性合作提升

"初次合作"(One-shot cooperation)——在首次遇到陌生伙伴时的合作意愿——在 SA 条件下显著提升。

传统理论预测:
首次相遇 → 没有历史记录 → 倾向背叛

SA 条件实际:
首次相遇 + 团队竞争压力 → 选择合作 ✓

这表明竞争压力激励了组内信任,即使在首次接触时也愿意合作。

关键发现 3:组内合作强化

                    外部竞争压力

    ┌─────────────────────────────────────┐
    │            团队内部                  │
    │                                     │
    │   智能体 A  ←──强化合作──→  智能体 B │
    │                                     │
    └─────────────────────────────────────┘

当团队面临外部竞争时,组内成员之间的合作率显著上升。


理论解释

进化心理学视角

人类社会中的超加性合作可能源于进化压力:

进化情境适应策略
部落间资源竞争强化部落内合作
外敌入侵威胁团结一致对外
集体狩猎需求分工协作

LLM 在训练数据中学习到了这种人类社会模式。

博弈论视角

囚徒困境基础收益矩阵:
                    对手
                合作    背叛
    自己  合作   3,3     0,5
          背叛   5,0     1,1

超加性条件修正:
- 团队获胜 → 额外奖励
- 团队内部合作 → 提高团队竞争力
- 形成新的纳什均衡: 合作更有利

与人类行为的对比

维度人类研究发现LLM 智能体发现
超加性效应✓ 存在✓ 存在
外敌促进团结✓ 显著✓ 显著
一次性合作提升✓ 观察到✓ 观察到
机制一致性进化压力训练数据学习

这种一致性表明 LLM 在某种程度上"继承"了人类的社会合作模式


实际应用意义

1. 多智能体系统设计

传统设计:单独优化每个智能体

新思路:设计适当的竞争结构来激发合作
设计策略效果
引入团队机制提升组内合作
设置适度外部竞争激发超加性效应
平衡竞合关系优化整体表现

2. AI 对齐启示

通过设计战略情境来引导 LLM 行为,而非仅依赖直接指令。

传统对齐:
"你必须合作"  →  效果有限

情境对齐:
创造需要合作才能获胜的环境  →  自发合作

3. 人机协作设计

人类团队 + AI 智能体

设置共同目标和外部挑战

激发"人-AI 超加性合作"

研究局限性

局限说明
模型范围仅测试 3 个模型
博弈类型仅囚徒困境
团队规模小团队设置
长期效应未研究持续竞争的影响

总结

这篇论文揭示了一个重要发现:LLM 智能体展现出与人类相似的超加性合作模式

核心发现意义
超加性效应存在竞争 + 合作 > 单独之和
一次性合作提升竞争压力激发初始信任
与人类一致LLM 学习到人类社会模式
设计启示通过情境设计引导合作行为

💡 核心洞察: 要让 AI 智能体更好地合作,不一定需要"命令"它们合作——创造一个需要团队合作才能赢的环境,合作行为会自然涌现。


参考资料

基于 MIT 许可证发布。内容版权归作者所有。