15.5 Exa:用 LangGraph 构建 Web 研究多智能体系统

来源:How Exa built a Web Research Multi-Agent System with LangGraph and LangSmith
公司简介
Exa 是一家提供高质量搜索 API 的公司,最近推出了深度研究智能体产品,能够自主探索网络以找到用户需要的结构化信息。
核心指标:
- 每日处理数百个研究查询
- 交付结果耗时 15 秒至 3 分钟(取决于复杂度)
产品演进路径
Exa 的产品经历了三个阶段的演进:
搜索 API → 答案端点 → 深度研究智能体随着架构复杂性增加,团队重新评估技术选项,最终采用 LangGraph 框架。这反映了行业趋势——复杂架构越来越多地选择 LangGraph。
技术架构
三层多智能体模式

| 层级 | 角色 | 职责 |
|---|---|---|
| 规划者 (Planner) | 分析查询 | 动态生成并行任务 |
| 任务 (Tasks) | 独立研究单元 | 使用专门工具执行搜索 |
| 观察者 (Observer) | 全局上下文 | 维护状态,输出清理后的结果 |
关键设计
- 任务仅接收清理后的输出,而非中间推理状态
- 参考了 Anthropic Deep Research 系统的设计理念
技术亮点
1. 动态任务生成
根据查询复杂度自动调整并行任务数量:
简单查询 → 少量并行任务
复杂查询 → 多个并行任务2. 搜索片段优化
搜索结果 → 先在摘要上推理 → 仅在需要时请求完整内容效果:显著减少 Token 使用,同时保持研究质量。
3. 结构化输出
所有级别均维持 JSON 格式输出:
json
{
"query": "用户查询",
"findings": [
{"source": "URL", "content": "摘要"},
...
],
"summary": "综合结论"
}通过函数调用生成结构化输出,确保 API 消费者获得可靠的输出格式。
LangSmith 的价值
"理解 Token 使用情况的可观测性...LangSmith 提供的这一点非常重要。设置也超级简单。"
—— Mark Pekala, Exa 软件工程师
LangSmith 核心价值:
| 功能 | 价值 |
|---|---|
| Token 使用追踪 | 为生产定价模型提供成本效率数据 |
| 简易设置 | 快速集成,无需复杂配置 |
| 可观测性 | 理解系统行为,优化性能 |
业务成果
| 指标 | 效果 |
|---|---|
| 处理速度 | 15 秒至 3 分钟(因复杂度而异) |
| Token 使用 | 显著降低 |
| 输出格式 | 可靠的结构化 JSON |
| 成本效率 | 支持生产定价模型 |
关键洞察
架构演进的启示
从简单 API 到复杂智能体系统的演进过程中,LangGraph 成为自然选择:
- 早期:简单的搜索 API 足够
- 中期:答案端点需要更多逻辑
- 后期:深度研究智能体需要多智能体编排
Token 优化策略
- 先在摘要上推理,减少不必要的全文获取
- 结构化输出减少冗余内容
- 动态任务数量避免过度并行
总结
Exa 的案例展示了如何用 LangGraph 构建生产级的 Web 研究智能体:
- 三层架构:规划者 + 任务 + 观察者
- 动态调整:根据查询复杂度调整并行度
- Token 优化:摘要优先 + 结构化输出
- 可观测性:LangSmith 追踪 Token 使用和成本
这个案例为构建研究类 AI 产品提供了优秀的架构参考。
上一篇:[15.4 Bertelsmann](./15.4 Bertelsmann.md)
下一篇:[15.6 Captide](./15.6 Captide.md)