大语言模型驱动的多智能体系统：群体智能应用

原标题: Multi-Agent Systems Powered by Large Language Models: Applications in Swarm Intelligence 作者: Cristian Jimenez-Romero (CY Cergy Paris University), Alper Yegenoglu (RWTH Aachen), Christian Blum (IIIA-CSIC) 发表: arXiv 预印本, 2025年3月链接: arXiv:2503.03800领域: 群体智能、仿生计算、多智能体仿真

一句话总结

这篇论文展示了如何用 LLM 替代传统的硬编码规则来驱动群体智能仿真（如蚂蚁觅食、鸟群飞行），发现 LLM 智能体能产生与规则系统相当的涌现行为，且混合系统表现更优。

研究背景

什么是群体智能？

群体智能 (Swarm Intelligence) 是指简单个体通过局部交互产生复杂集体行为的现象：

┌─────────────────────────────────────────────────────────────┐
│                    群体智能的核心原理                        │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   简单规则            局部交互           涌现的复杂行为      │
│  ┌─────────┐        ┌─────────┐        ┌─────────────────┐  │
│  │ 跟随邻居 │   →    │ 个体互动 │   →    │ 鸟群 V 字队形   │  │
│  │ 避免碰撞 │        │ 信息传递 │        │ 蚁群最优路径    │  │
│  │ 趋向中心 │        │ 自组织   │        │ 鱼群协调游动    │  │
│  └─────────┘        └─────────┘        └─────────────────┘  │
└─────────────────────────────────────────────────────────────┘

💡 通俗理解: 没有领导者，没有全局规划，每个个体只遵循简单规则并与邻居互动，却能产生惊人的集体智慧。

传统方法 vs LLM 方法

维度	传统规则方法	LLM 驱动方法
行为定义	硬编码规则	自然语言指令
灵活性	固定	高度灵活
适应性	需要重新编程	修改提示即可
计算成本	低	高

两种提示方法

方法 1：结构化规则提示 (Ant Foraging)

适用场景: 蚂蚁觅食仿真

提示风格: 明确、确定性的条件-动作规则

┌─────────────────────────────────────────────────────────────┐
│              结构化规则提示示例                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  "你是一只蚂蚁，遵循以下规则：                               │
│                                                             │
│   1. 如果你不携带食物：                                      │
│      - 如果感知到食物信息素，沿着信息素浓度最高的方向移动    │
│      - 否则，随机移动                                        │
│                                                             │
│   2. 如果你携带食物：                                        │
│      - 沿着巢穴气味最强的方向移动                            │
│      - 在路径上释放信息素                                    │
│                                                             │
│   3. 如果到达巢穴并携带食物：                                │
│      - 放下食物，转变为觅食状态"                             │
└─────────────────────────────────────────────────────────────┘

方法 2：知识驱动提示 (Bird Flocking)

适用场景: 鸟群飞行仿真

提示风格: 一般性原则，允许智能体自主推理

┌─────────────────────────────────────────────────────────────┐
│              知识驱动提示示例                                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  "你是一只鸟，遵循 Boids 飞行原则：                          │
│                                                             │
│   1. 分离 (Separation)：                                     │
│      避免与邻近的鸟靠得太近                                  │
│                                                             │
│   2. 对齐 (Alignment)：                                      │
│      将你的飞行方向与邻近鸟群的平均方向对齐                  │
│                                                             │
│   3. 凝聚 (Cohesion)：                                       │
│      向邻近鸟群的中心位置移动                                │
│                                                             │
│   根据当前环境状态，决定你的下一步移动。"                    │
└─────────────────────────────────────────────────────────────┘

对比分析

特征	结构化规则提示	知识驱动提示
明确性	高（条件-动作明确）	低（原则性指导）
灵活性	低	高
可预测性	高	中
创造性	低	高
适用场景	确定性任务	需要判断的任务

实验场景

场景 1：蚂蚁觅食仿真

┌─────────────────────────────────────────────────────────────┐
│                    蚂蚁觅食环境                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│              🍎 食物源 A                                     │
│                  ↑                                          │
│                  │  信息素路径                              │
│                  │                                          │
│         🐜 🐜 🐜 │ 🐜 🐜                                    │
│                  │                                          │
│              🏠 巢穴                                         │
│                  │                                          │
│                  ↓                                          │
│              🍎 食物源 B                                     │
└─────────────────────────────────────────────────────────────┘

关键机制:

信息素追踪
巢穴气味感知
食物收集与运输

实验发现:

LLM 蚂蚁需要迭代提示优化才能达到规则蚂蚁的表现
混合蚁群（LLM + 规则）效率最高

场景 2：鸟群飞行仿真

┌─────────────────────────────────────────────────────────────┐
│                    Boids 三原则                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   分离 (Separation)                                         │
│   ┌───────────────────────────────────────────────────────┐ │
│   │      ↖     ↗                                         │ │
│   │        🐦                                             │ │
│   │      ↙     ↘       避免碰撞，保持距离                 │ │
│   └───────────────────────────────────────────────────────┘ │
│                                                             │
│   对齐 (Alignment)                                          │
│   ┌───────────────────────────────────────────────────────┐ │
│   │   →  →  →  →  →    朝同一方向飞                       │ │
│   └───────────────────────────────────────────────────────┘ │
│                                                             │
│   凝聚 (Cohesion)                                           │
│   ┌───────────────────────────────────────────────────────┐ │
│   │      ↘           ↙                                   │ │
│   │          ⬤                                            │ │
│   │      ↗   中心   ↖      向群体中心靠拢                 │ │
│   └───────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────┘

实验发现:

LLM 鸟群保持了连贯的队形
表现出更强的碰撞避免能力
对空间的解读与规则系统略有不同

关键发现

发现 1：LLM 可替代硬编码规则

传统方法                          LLM 方法
┌─────────────────┐             ┌─────────────────┐
│ if 感知食物:     │             │ "你是一只蚂蚁,  │
│   走向食物       │    →        │  如果感知到食物 │
│ else:           │             │  就走向它..."   │
│   随机移动       │             │                │
└─────────────────┘             └─────────────────┘
      代码                            自然语言

验证: 经过精心设计的提示，LLM 智能体达到了与传统规则系统相当的性能。

发现 2：混合系统效率最高

           效率
    高 │       ★ 混合系统 (LLM + 规则)
       │      ╱
       │     ╱  ◆ 纯规则系统
       │    ╱
       │   ╱    ○ 纯 LLM 系统 (优化后)
    低 │  ╱
       │ ╱      △ 纯 LLM 系统 (未优化)
       └─────────────────────────
       迭代优化次数

混合优势:

LLM 智能体提供适应性和创造性
规则智能体提供可靠性和效率
组合后兼具两者优势

发现 3：提示工程至关重要

"微小的提示修改会显著影响集体模式"

提示调整	行为变化
增加"避免碰撞"权重	群体更分散
强调"跟随邻居"	群体更紧密
添加"探索未知区域"	覆盖范围扩大

发现 4：LLM 的空间解读差异

LLM 对空间和数值信息的解读与规则系统存在微妙差异：

规则系统: "移动到坐标 (10, 15)"  → 精确到达 (10, 15)
LLM 系统: "移动到坐标 (10, 15)"  → 到达约 (9.8, 15.2) 附近

→ 这种"模糊性"可能带来意外的适应性优势

技术实现

NetLogo + LLM 集成

┌─────────────────────────────────────────────────────────────┐
│                    系统架构                                  │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   ┌─────────────┐                  ┌─────────────┐          │
│   │  NetLogo    │ ←───环境状态───→ │    LLM      │          │
│   │  仿真环境   │                  │   (GPT等)   │          │
│   └─────────────┘                  └─────────────┘          │
│         │                                │                  │
│         │ 执行动作                       │ 决策            │
│         ▼                                ▼                  │
│   ┌─────────────────────────────────────────────────────┐  │
│   │                  智能体行为                          │  │
│   │   感知 → 推理 → 决策 → 行动 → 环境反馈              │  │
│   └─────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────┘

实时反馈循环

python

# 概念示例：LLM 群体智能主循环
while simulation_running:
    for agent in agents:
        # 1. 感知环境
        perception = agent.perceive(environment)

        # 2. 构造提示
        prompt = build_prompt(
            agent_role="ant",
            perception=perception,
            rules=foraging_rules
        )

        # 3. LLM 决策
        action = llm.generate(prompt)

        # 4. 执行动作
        agent.execute(action)

        # 5. 更新环境
        environment.update()

局限性与挑战

挑战	说明	可能的解决方案
计算成本	API 调用昂贵	本地小模型
延迟	实时性不足	批量决策
一致性	LLM 输出不确定	结构化输出
可扩展性	大规模智能体困难	分层架构

实际应用前景

潜在应用领域

领域	应用	LLM 优势
机器人群	搜救、探索	适应未知环境
交通	自动驾驶车队	复杂决策
物流	仓库调度	动态优化
社会仿真	人群行为模拟	更真实的个体行为

未来方向

当前: 单模型驱动简单智能体
      ↓
近期: 混合系统 (LLM + 规则)
      ↓
远期: 多模型协作的复杂群体系统

总结

这篇论文开创性地将 LLM 引入群体智能仿真，验证了自然语言可以替代硬编码规则来驱动群体行为：

发现	意义
LLM 可替代规则	更灵活的群体智能设计
混合系统最优	实用的系统架构指导
提示工程关键	行为设计的新范式
涌现行为保留	LLM 不破坏集体智能

💡 核心洞察: 群体智能的本质是涌现——不管底层是规则还是 LLM，只要个体遵循正确的局部原则并进行交互，复杂的集体行为就会自然产生。LLM 为这个过程带来了前所未有的灵活性。

大语言模型驱动的多智能体系统：群体智能应用 ​

一句话总结 ​

研究背景 ​

什么是群体智能？ ​

传统方法 vs LLM 方法 ​

两种提示方法 ​

方法 1：结构化规则提示 (Ant Foraging) ​

方法 2：知识驱动提示 (Bird Flocking) ​

对比分析 ​

实验场景 ​

场景 1：蚂蚁觅食仿真 ​

场景 2：鸟群飞行仿真 ​

关键发现 ​

发现 1：LLM 可替代硬编码规则 ​

发现 2：混合系统效率最高 ​

发现 3：提示工程至关重要 ​

发现 4：LLM 的空间解读差异 ​

技术实现 ​

NetLogo + LLM 集成 ​

实时反馈循环 ​

局限性与挑战 ​

实际应用前景 ​

潜在应用领域 ​

未来方向 ​

总结 ​

参考资料 ​