Hi my new friend!

LLM Agent 常用范式详解

Scroll down

本文整理了 LLM Agent 中常用的几种范式,从简单到复杂,详细介绍每种范式的概念、工作原理、特点、适用场景、流程示意以及优势与局限。

单步回答型(Single-step / Direct Response)

单步回答型是最基础的 LLM Agent 范式,特点是收到问题或任务后直接生成答案,不保留历史状态,也不调用外部工具。
简单理解:“你问我答,不做额外思考”

工作原理

  • 接收输入:用户发送问题或任务描述给模型。
  • 生成输出:模型根据训练中学到的语言模式和知识生成答案。
  • 返回结果:输出文本返回给用户。

注意:整个过程没有循环、计划或外部验证,完全依赖模型自身知识。

特点

  • 快速:无需多轮推理或外部查询。
  • 实现简单:只需调用生成接口即可。
  • 依赖训练数据:输出结果依赖模型已有知识。

适用场景

  • 事实类问答:如“世界上最高的山是哪座?”
  • 知识查询:如“谁写了《哈利·波特》?”
  • 简单计算或翻译:如“把‘Hello’翻译成中文”。

流程示意

优势与局限

  • 优势:快速、易实现,对简单任务足够使用。
  • 局限:无法处理多步骤问题或实时信息,缺乏可解释性。

链式思维型(Chain-of-Thought, CoT)

链式思维型让 LLM 在生成答案之前先写出思考步骤,增加可解释性。
简单理解:“先写下我的思路,再给你答案”

工作原理

  1. 接收输入:用户提供问题或任务。
  2. 生成思考步骤:模型拆解问题、分析子问题或列出公式。
  3. 生成答案:结合思考步骤输出最终结果。
  4. 返回结果:输出既包含思考步骤,也包含答案。

注意:链式思维型通常一次生成,不会根据结果再循环修正,除非与 ReAct 或反思型结合。

特点

  • 显式推理,增强可解释性。
  • 支持多步骤问题处理。
  • 依赖模型内部知识,无外部工具调用能力。

适用场景

  • 数学题、逻辑题
  • 多步骤推理问题
  • 需要分析过程的问答

流程示意

优势与局限

  • 优势:提高复杂问题正确率,增强信任度。
  • 局限:无法调用外部数据,输出长度较长,处理速度略慢。

ReAct(Reasoning + Acting)

ReAct 结合 推理和行动,让模型在思考的同时可以执行操作,并根据结果不断调整策略。
简单理解:“先想,再做,边做边想”

工作原理

  1. 接收输入:用户提供任务。
  2. 推理(Reasoning):分析问题,生成解决思路。
  3. 行动(Acting):执行操作,如调用工具、查询数据、计算等。
  4. 反馈:行动结果返回模型,供下一轮推理。
  5. 循环迭代:模型根据反馈不断调整,直到完成任务。
  6. 输出答案:最终返回结果。

特点

  • 动态交互,可根据环境或工具结果调整策略。
  • 支持多步骤任务处理。
  • 可以调用外部工具或 API。
  • 推理链条透明,便于理解。

适用场景

  • 查询实时数据(天气、股市、新闻)
  • 多步骤问答或推理任务
  • 自动化办公任务(数据处理、报告生成)

流程示意

优势与局限

  • 优势:适合复杂任务,支持工具调用,循环迭代可提高准确性。
  • 局限:实现复杂,循环可能增加响应时间。

反思型(Reflexive Agent)

反思型让 LLM 在输出前自我检查和修正,类似人类写完作业后回头自查。
简单理解:“先写,再检查,再修正”

工作原理

  1. 接收输入
  2. 初步生成答案
  3. 自我反思:检查语法、逻辑或数据合理性
  4. 修正输出
  5. 最终输出

特点

  • 内部自查循环,提升输出质量。
  • 无需外部工具。
  • 适合长文本或多轮任务。

适用场景

  • 自动写作(文章、报告、邮件)
  • 长对话系统保持逻辑一致
  • 编程辅助:生成代码并检查逻辑/语法

流程示意

任务规划型(Planner + Executor)

任务规划型将复杂任务拆分为子任务并逐步执行,核心是“规划 + 执行”。
简单理解:“先规划,再执行,每步有条理”

工作原理

  1. 接收输入
  2. 规划阶段:拆解任务、排列子任务顺序
  3. 执行阶段:逐步完成子任务,可调用工具
  4. 整合结果:汇总各子任务输出
  5. 最终输出

特点

  • 适合多步骤任务
  • 结构清晰
  • 可结合工具
  • 支持长任务处理

流程示意

记忆增强型(Memory-Augmented Agent)

记忆增强型具有长期记忆能力,在多轮对话或长期任务中持续利用历史信息。
简单理解:“记住过去,做出更智能的决策”

工作原理

  1. 接收输入
  2. 访问记忆:检索历史信息或上下文
  3. 生成答案:结合当前输入和记忆
  4. 更新记忆:保存新信息
  5. 返回输出

特点

  • 长期记忆与个性化
  • 上下文连续,多轮任务一致性
  • 可动态更新

流程示意

多 Agent 协作型(Multi-Agent / Team Agents)

多 Agent 协作型由多个 Agent 分工协作完成任务
简单理解:“分工合作,每个成员做擅长的事”

工作原理

  1. 接收输入
  2. 任务拆分与分配:将任务分配给不同 Agent
  3. 各 Agent 执行任务
  4. 信息汇总:整合输出
  5. 最终输出

特点

  • 分工明确
  • 可扩展性强
  • 协作与信息整合
  • 每个 Agent 可调用工具

流程示意

总结

从简单到复杂的 LLM Agent 范式:

单步回答 → 链式思维 → ReAct → 反思型 → 任务规划 → 记忆增强 → 多 Agent 协作

  • 越往右,模型能力越强,处理复杂任务能力越高。
  • 越往右,实现成本越高,但灵活性和适用性也越强。
  • 在实际应用中,常会混合使用多种范式,发挥各自优势,提升准确性和任务处理能力。
  • 本文作者:白云苍狗
  • 本文链接:
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
其他文章
cover
hexo-theme-async 使用指北
  • 22-09-07
  • 07:29
  • 记录类
cover
利用 AI 编程提效体验
  • 25-03-25
  • 07:46
  • 记录类
本站已加入BLOGS·CN