Skip to content

ReAct 循环

Reasoning + Acting,思考、行动、观察的循环,Agent 核心执行模式。

2022 年论文:ReAct: Synergizing Reasoning and Acting in Language Models

核心流程

  1. 输入提示词,LLM 思考下一步动作
  2. 调用工具、执行动作,得到输出结果
  3. 观察结果、输入给下一轮思考
  4. 终止条件:LLM 认为任务完成,或触发约束 (最大轮数/预算耗尽/无新进展)

终止条件

条件说明优先级
用户中断用户主动停止0
预算耗尽达到 token/成本上限,强制停止0.5
超时达到端到端时延上限,强制停止0.5
最大轮数达到预设的 MaxIterations1
最小轮数强制执行指定轮数2
任务完成LLM 明确表示任务已完成3
结果收敛连续两次观察结果很像,没有新进展4