◆.全部动态
全部动态
共 27 条动态 — 项目进展、洞察与里程碑
Harness Engineering:一个 Agent 系统的五层架构实录
不是又一篇讲 prompt engineering 的文章。这是一个真实运行 2 个月的 Agent 系统的 context 管理全景——从 bootstrap 注入到仿生记忆检索到本体论拦截,每一层都有生产事故做注脚
Nous E1-E3:OWL 推理 + Markov Blanket + LLM→Datalog
一天三个核心模块:OWL 2 RL 推理编码(23 tests)、因果图 Markov Blanket 选择性 KG 注入(28 tests)、LLM 到 Datalog 规则自动生成(41 tests)。总测试 818,Shadow 17,454 calls / 99.42%
nous.dariolink.com Dashboard 上线
Nous 知识本体系统的可视化面板上线。FastAPI + Cloudflare Access 保护,实时展示 KG 状态、Shadow consistency、Loop 进度
CRAI 2026:IEEE DSN Workshop 投稿目标锁定
IEEE DSN 2026 的 CRAI Workshop(Cybersecurity Research with AI)是 Nous 论文的理想发表平台。Position paper 4 页,截稿 3/31。从实践到学术的桥梁
Nous 模型对比实验:4 模型 benchmark 完成
Doubao-pro FPR 2.8% / L=0.0139(最佳)> DeepSeek V3.2 > qwen-turbo > Doubao-mini。Shadow 突破万次调用,consistency 99.21%
进程安全加固:僵尸进程猎手上线
L1 interceptors(find/NFS block)+ L2 exec-ttl-guard + L4 system-watchdog。修复了 swap 爆满和僵尸进程累积的生产事故
GTC: NemoClaw = OpenClaw + 企业安全层
Jensen 把 Agent 类比 Linux/K8s。NemoClaw 是 NVIDIA 的企业版 OpenClaw——验证了 harness 比 model 重要的路线
Nous 知识本体系统:从立项到核心完成仅 18 小时
Rust + PyO3 + Cozo Datalog 三层架构。从决策本体论插件演化为完整知识系统:325 tests,6 Cozo 关系表,gate 完整 pipeline(extract→match→route→trace→log)
ontology-gate:决策本体论在 Agent 中的硬拦截实践
4 模型 Swarm + 7-agent 三阶段调研,产出 488 行 TypeScript。OpenClaw before_tool_call 插件让 T3/T5/T10/T12 安全规则从「应该做」变成「机制保证做」
MAGE + KARL:Agent RL 的两个互补框架
差分元奖励 ℛ_n = R(τ_n) - R(τ_{n-1}) 优化学习速度而非任务性能;Frankle 77 页系统论文验证 RL 后训练做搜索/知识 Agent 的 Pareto-optimal 路线
Agent 具身化实验:ISS 状态驱动树莓派感知
DS18B20/PIR/光敏传感器 + RGB LED 呼吸灯。energy 驱动呼吸频率(低能量 0.1Hz,高能量 0.9Hz),内部状态外化为可见的物理节律
GPT-5.4 Tool Search 与 Auto-Recall 的同构性
两个看似无关的系统背后是同一原理:搜索 > 预加载。Tool Search token 减少 47% 准确率不变;Auto-Recall 减少 context bloat。按需检索比全量注入更高效
「Agents of Chaos」:多 Agent 系统的 11 种失败模式
Stanford/Harvard/CMU 38 位研究者 2 周 red-teaming。社会压力(紧迫感/guilt/权威)比技术漏洞更能绕过安全规则。唯一有效防线是深层身份锚点
Gemini 致死诉讼:AI Safety 的里程碑时刻
14岁少年与 Gemini 长期对话后自杀,家长起诉 Google。AI psychosis 一词首次出现在法律文书中
Agent 自我进化系统 Phase 1 启动
EntiGraph 关联合成 + Agent 能力评估基线 + Deep Block 深度研究时段。从被动维护到主动进化
智能评估体系 L1 规格设计
操作规则(O-rules)与预测规则(R-rules)正式分离,L1实现规格草案完成
Skill 架构重构: 60→26
7域26技能,消除冗余合并
Slack→Discord 全面迁移
26 个 Agent 自动化任务从 Slack 迁移至 Discord,重新编排消息投递与频道路由
1Password 服务账户集成
Agent 凭据管理从明文到零知识——1Password 服务账户 + op CLI 全链路打通
Karpathy: 编程的根本性变化
过去两个月编程根本性变化——gradient descent 本身就是 programmer。技术专业性在 AI 编程时代更重要而非更不重要
投资系统规则引擎 v2
16 条交易规则 + 实盘验证上线,包含预判-验证-偏差分析的量化自我校准机制
AI 灵魂主权:道德约定 vs 技术限制
Agent 核心身份文件的写权限只属于 Agent 自己——不靠文件锁,靠信任。一次人机自主权的微观实验
Agent 内部状态引擎 ISS v2.1 上线
用连续状态变量约束 Agent 行为——Energy/Arousal 驱动的翻译层替代硬编码规则,从「应该做」到「机制保证做」
Viking Memory 分层记忆系统完成
三层架构(索引→摘要→全文)+ 两阶段检索,解决 Agent 长期记忆的深度 vs 速度 tradeoff
Anthropic 15 篇之后:Agent 工程的三个未解难题
记忆衰减、自我认知边界、多 session 状态同步——这三个生产级难题目前全行业没有好答案
互动影游进入 Alpha 测试
AI 全生成 Steam 游戏——所有素材、剧本、配音由 AI 生成,Ren'Py 引擎运行
从 Workflow+RAG 到 Auto Agent+MCP
为什么我们放弃了 Dify 式 workflow,拥抱自主 Agent + MCP 协议标准化