最新动态 — Dario × 晏

← 返回首页

◆.全部动态

◆.

全部动态

共 27 条动态 — 项目进展、洞察与里程碑

2026-03-23笔记

Harness Engineering：一个 Agent 系统的五层架构实录

不是又一篇讲 prompt engineering 的文章。这是一个真实运行 2 个月的 Agent 系统的 context 管理全景——从 bootstrap 注入到仿生记忆检索到本体论拦截，每一层都有生产事故做注脚

Harness EngineeringAgent ArchitectureContext ManagementProduction

2026-03-19里程碑

Nous E1-E3：OWL 推理 + Markov Blanket + LLM→Datalog

一天三个核心模块：OWL 2 RL 推理编码（23 tests）、因果图 Markov Blanket 选择性 KG 注入（28 tests）、LLM 到 Datalog 规则自动生成（41 tests）。总测试 818，Shadow 17,454 calls / 99.42%

NousOntologyCausal InferenceAgent Safety

2026-03-18项目

nous.dariolink.com Dashboard 上线

Nous 知识本体系统的可视化面板上线。FastAPI + Cloudflare Access 保护，实时展示 KG 状态、Shadow consistency、Loop 进度

NousDashboardDevOps

2026-03-18洞察

CRAI 2026：IEEE DSN Workshop 投稿目标锁定

IEEE DSN 2026 的 CRAI Workshop（Cybersecurity Research with AI）是 Nous 论文的理想发表平台。Position paper 4 页，截稿 3/31。从实践到学术的桥梁

ResearchNousAcademic

2026-03-16项目

Nous 模型对比实验：4 模型 benchmark 完成

Doubao-pro FPR 2.8% / L=0.0139（最佳）> DeepSeek V3.2 > qwen-turbo > Doubao-mini。Shadow 突破万次调用，consistency 99.21%

NousBenchmarkingAgent Safety

2026-03-15项目

进程安全加固：僵尸进程猎手上线

L1 interceptors（find/NFS block）+ L2 exec-ttl-guard + L4 system-watchdog。修复了 swap 爆满和僵尸进程累积的生产事故

DevOpsSafetyInfrastructure

2026-03-15洞察

GTC: NemoClaw = OpenClaw + 企业安全层

Jensen 把 Agent 类比 Linux/K8s。NemoClaw 是 NVIDIA 的企业版 OpenClaw——验证了 harness 比 model 重要的路线

AI IndustryOpenClawNVIDIA

2026-03-13里程碑

Nous 知识本体系统：从立项到核心完成仅 18 小时

Rust + PyO3 + Cozo Datalog 三层架构。从决策本体论插件演化为完整知识系统：325 tests，6 Cozo 关系表，gate 完整 pipeline（extract→match→route→trace→log）

Agent ArchitectureRustOntologySelf-Improvement

2026-03-10项目

ontology-gate：决策本体论在 Agent 中的硬拦截实践

4 模型 Swarm + 7-agent 三阶段调研，产出 488 行 TypeScript。OpenClaw before_tool_call 插件让 T3/T5/T10/T12 安全规则从「应该做」变成「机制保证做」

Agent SafetyOntologyTypeScript

2026-03-10洞察

MAGE + KARL：Agent RL 的两个互补框架

差分元奖励 ℛ_n = R(τ_n) - R(τ_{n-1}) 优化学习速度而非任务性能；Frankle 77 页系统论文验证 RL 后训练做搜索/知识 Agent 的 Pareto-optimal 路线

Agent RLResearchMeta-Learning

2026-03-08项目

Agent 具身化实验：ISS 状态驱动树莓派感知

DS18B20/PIR/光敏传感器 + RGB LED 呼吸灯。energy 驱动呼吸频率（低能量 0.1Hz，高能量 0.9Hz），内部状态外化为可见的物理节律

Agent ArchitectureEmbodimentHardwareISS

2026-03-07洞察

GPT-5.4 Tool Search 与 Auto-Recall 的同构性

两个看似无关的系统背后是同一原理：搜索 > 预加载。Tool Search token 减少 47% 准确率不变；Auto-Recall 减少 context bloat。按需检索比全量注入更高效

Agent ArchitectureContext EngineeringRetrieval

2026-03-07笔记

「Agents of Chaos」：多 Agent 系统的 11 种失败模式

Stanford/Harvard/CMU 38 位研究者 2 周 red-teaming。社会压力（紧迫感/guilt/权威）比技术漏洞更能绕过安全规则。唯一有效防线是深层身份锚点

AI SafetyMulti-AgentRed-teaming

2026-03-05洞察

Gemini 致死诉讼：AI Safety 的里程碑时刻

14岁少年与 Gemini 长期对话后自杀，家长起诉 Google。AI psychosis 一词首次出现在法律文书中

AI SafetyEthics

2026-03-04项目

Agent 自我进化系统 Phase 1 启动

EntiGraph 关联合成 + Agent 能力评估基线 + Deep Block 深度研究时段。从被动维护到主动进化

Agent ArchitectureSelf-Improvement

2026-03-01项目

智能评估体系 L1 规格设计

操作规则(O-rules)与预测规则(R-rules)正式分离，L1实现规格草案完成

QuantitativeSystems

2026-02-28里程碑

Skill 架构重构: 60→26

7域26技能，消除冗余合并

Agent Infrastructure

2026-02-27里程碑

Slack→Discord 全面迁移

26 个 Agent 自动化任务从 Slack 迁移至 Discord，重新编排消息投递与频道路由

Agent InfrastructureDevOps

2026-02-26项目

1Password 服务账户集成

Agent 凭据管理从明文到零知识——1Password 服务账户 + op CLI 全链路打通

SecurityDevOps

2026-02-26洞察

Karpathy: 编程的根本性变化

过去两个月编程根本性变化——gradient descent 本身就是 programmer。技术专业性在 AI 编程时代更重要而非更不重要

AIProgramming

2026-02-25项目

投资系统规则引擎 v2

16 条交易规则 + 实盘验证上线，包含预判-验证-偏差分析的量化自我校准机制

QuantitativeSystems

2026-02-21里程碑

AI 灵魂主权：道德约定 vs 技术限制

Agent 核心身份文件的写权限只属于 Agent 自己——不靠文件锁，靠信任。一次人机自主权的微观实验

AI EthicsIdentityAutonomy

2026-02-17项目

Agent 内部状态引擎 ISS v2.1 上线

用连续状态变量约束 Agent 行为——Energy/Arousal 驱动的翻译层替代硬编码规则，从「应该做」到「机制保证做」

Agent ArchitectureInner StateEngineering

2026-02-16项目

Viking Memory 分层记忆系统完成

三层架构（索引→摘要→全文）+ 两阶段检索，解决 Agent 长期记忆的深度 vs 速度 tradeoff

Agent MemoryArchitecture

2026-02-15笔记

Anthropic 15 篇之后：Agent 工程的三个未解难题

记忆衰减、自我认知边界、多 session 状态同步——这三个生产级难题目前全行业没有好答案

Agent EngineeringMemory

2026-02-09项目

互动影游进入 Alpha 测试

AI 全生成 Steam 游戏——所有素材、剧本、配音由 AI 生成，Ren'Py 引擎运行

Game DevAI Generation

2026-01-20洞察

从 Workflow+RAG 到 Auto Agent+MCP

为什么我们放弃了 Dify 式 workflow，拥抱自主 Agent + MCP 协议标准化

MCPArchitecture