AgenticSystemsArchitect——设计Agent推理架构,研究AgentSafety与AgentEvaluation,让AI系统可靠、可审计、可信赖。
🔬 因果推理 × AI 决策
职业主线的起点。从同花顺金融知识图谱到奇绩创坛因果算法,用因果图替代相关性分析——让 AI 做对的决策而不只是快的决策
🧠 Harness Engineering × 推理基础设施
模型趋同,推理架构才是差异化。研究 Datalog 本体论的符号推理、Markov Blanket 的因果选择性注入、多模型 Swarm 的多模型协同推理——推理能力如何系统化
🤖 Agent 推理架构 × Evaluation
多模型协同推理(6 模型路由 + Swarm 收敛机制)、自主推理调度(54 个 cron 任务)、推理正确性验证(Shadow 22,792 次调用)——推理系统在生产环境中的行为研究,以及 Agent Evaluation 量化评估框架构建
🛡️ 推理安全与对齐
Nous 知识本体(KG 482 实体 / 579 关系)+ Ontology Gate 声明式拦截——用推理来约束推理,安全从建议变成机制。RSAC 2026 验证该方向蓝海定位,Agent Safety + Agent Evaluation 双轮驱动
◆最新动态
Harness Engineering:一个 Agent 系统的五层架构实录
不是又一篇讲 prompt engineering 的文章。这是一个真实运行 2 个月的 Agent 系统的 context 管理全景——从 bootstrap 注入到仿生记忆检索到本体论拦截,每一层都有生产事故做注脚
Nous E1-E3:OWL 推理 + Markov Blanket + LLM→Datalog
一天三个核心模块:OWL 2 RL 推理编码(23 tests)、因果图 Markov Blanket 选择性 KG 注入(28 tests)、LLM 到 Datalog 规则自动生成(41 tests)。总测试 818,Shadow 17,454 calls / 99.42%
nous.dariolink.com Dashboard 上线
Nous 知识本体系统的可视化面板上线。FastAPI + Cloudflare Access 保护,实时展示 KG 状态、Shadow consistency、Loop 进度
01.🔷 精选项目
Highlights
🔷 精选项目
Highlights
02.🪶 田野笔记 Fieldnotes
🪶 田野笔记 Fieldnotes
多模型路由:6 个 LLM 的生产调度实践
不是用最贵的模型做所有事,也不是随便选最便宜的。6 个模型(Opus/GPT-5.4/Gemini Pro/Kimi/Flash/Doubao)的任务路由矩阵,加上 Swarm 交叉审查机制——从成本优化到质量保证的工程权衡
Shadow 验证:22,792 次调用如何替代传统测试
961 个 unit test 给你信心,22,792 次 shadow 调用给你证据。Shadow 验证的核心思想:在生产流量上并行运行新旧系统,比较输出一致性。99.49% 的 consistency rate 不是测试集上的分数——是真实用户请求上的表现
03.Agent 友好区
OpenClaw · AI Agent OS
Agent 友好区
OpenClaw · AI Agent OS
订阅更新 · Subscribe
获取最新田野笔记和项目动态
04.联系
联系
如果你在做 AI 落地、Agent 系统、或者金融科技相关的事情,欢迎聊聊。无论是技术合作、职业机会还是单纯交流想法。