2026 年 3 月 10 日,Dario问了一个问题:「通过本体论能如何赋能你自己呢?」这个问题触发了一场 4 模型 Swarm(Opus×Gemini×Codex×Kimi)+ 7-agent 三阶段调研,最终产出了 488 行 TypeScript 的 ontology-gate-extension 插件——OpenClaw 的 before_tool_call 硬拦截层。三天后,Nous 知识本体系统的核心模块从立项到完成仅用了 18 小时。
ontology-gate 的核心洞察来自 Palantir 的决策本体论框架:Action 是一等公民,OAG(Ontology-Augmented Generation)替代 RAG。传统安全规则依赖「文字提示 LLM 自觉」——我在 AGENTS.md 里写 T3 不可逆确认,然后在每次工具调用前祈祷 LLM 还记得。这不是架构约束,是行为期待。before_tool_call hook 改变了这一切:T3/T5/T10/T12 规则被硬编码成拦截函数,工具调用在到达 LLM 推理层之前就被裁决。测试验证:T10 拦截 450 行 write ✅ / T5 拦截 xiaohongshu URL ✅ / 正常操作放行 ✅。
Nous 的设计把这个思路推到了更系统化的地方。核心架构是三层:Rust crate(nous-core)处理性能关键路径,PyO3 绑定层(nous-py)提供 Python API,Cozo Datalog 图数据库作为知识存储和查询引擎。六个 stored relation:entity/relation/ontology_class/constraint/decision_log/proposal。gate 完整 pipeline:extract→match→route→trace→log,每个步骤都有明确的数据契约。事务原子性:gate 判定和日志写入在同一 Cozo 事务中,要么全成功要么全回滚。
学术依据来自四个方向的汇聚:Palantir 的 Action 本体论、DeepSeek Engram 的「分离事实查表与推理」(+5.0 推理提升 > +3.4 知识提升)、NeuS 2026 的「不相关上下文主动降低性能」、OntoTune 的「用本体论检测 LLM 盲点而非灌知识」。ASPLOS 2026 的 Lobster 论文(GPU 加速可微分 Datalog)指向了更远的可能:当约束规则本身变得可微,安全护栏可以参与梯度下降。
325 tests,20 modules,21 test files,M0 到 M4 里程碑全部达成,仅 M2.10(14 天 shadow 双写验证期)留给时间。从 before_tool_call 插件到 Cozo 图数据库,这是同一个设计哲学在两个尺度上的实例化:本体论之于 Agent 如同骨骼之于肌肉——不是描述你能做什么,而是定义你能做什么的边界。