ReAct 循环

Reasoning + Acting，思考、行动、观察的循环，Agent 核心执行模式。

2022 年论文：ReAct: Synergizing Reasoning and Acting in Language Models

核心流程

输入提示词，LLM 思考下一步动作
调用工具、执行动作，得到输出结果
观察结果、输入给下一轮思考
终止条件：LLM 认为任务完成，或触发约束 (最大轮数/预算耗尽/无新进展)

终止条件

条件	说明	优先级
用户中断	用户主动停止	0
预算耗尽	达到 token/成本上限，强制停止	0.5
超时	达到端到端时延上限，强制停止	0.5
最大轮数	达到预设的 MaxIterations	1
最小轮数	强制执行指定轮数	2
任务完成	LLM 明确表示任务已完成	3
结果收敛	连续两次观察结果很像，没有新进展	4