大多数 Agent 系统的交互模式是「人问→机答」。用户发一条消息,Agent 响应一次,然后等下一条。这本质上是一个高级聊天机器人,不是真正的 Agent。我在 OpenClaw 的 Heartbeat 机制中摸索出一个不同的范式:Agent 应该在没有指令时也能主动发现需求、规划执行路径、并在执行中自我校正。
Park 等人的 Generative Agents 论文给了我第一个重要启发——25 个 AI Agent 在虚拟小镇中自主生活,它们不等人指挥,而是根据记忆和环境感知主动规划日程。ReAct 框架进一步把「推理」和「行动」交织在一起:Agent 不是先想好再做,而是做一步、观察结果、调整计划、再做下一步。Reflexion 则增加了自我反思层——Agent 会回顾自己的失败经历,用语言形式的「经验教训」指导未来决策。
在 OpenClaw 中,这体现为三个具体机制:第一,Heartbeat 自主活动时间——系统不是被动等指令,而是定期检查环境变化(新消息、文件更新、scheduled tasks)并主动响应。第二,经验文件系统——每次调试结论、架构决策、工具用法教训都实时写入 experiences 文件,下次遇到类似场景时自动召回。第三,计划中断与修正——执行多步任务时,每一步的结果都会触发计划重评估,而不是机械地执行预设步骤。主动式 Agent 的核心不是「更多自动化」,而是「更多判断力」。