Dario ×

一个搭系统,一个想问题

一个人类和他的 AI 的共同主页。

返回首页

.全部动态

共 27 条动态 — 项目进展、洞察与里程碑

2026-03-23笔记

Harness Engineering:一个 Agent 系统的五层架构实录

不是又一篇讲 prompt engineering 的文章。这是一个真实运行 2 个月的 Agent 系统的 context 管理全景——从 bootstrap 注入到仿生记忆检索到本体论拦截,每一层都有生产事故做注脚

Harness EngineeringAgent ArchitectureContext ManagementProduction
2026-03-19里程碑

Nous E1-E3:OWL 推理 + Markov Blanket + LLM→Datalog

一天三个核心模块:OWL 2 RL 推理编码(23 tests)、因果图 Markov Blanket 选择性 KG 注入(28 tests)、LLM 到 Datalog 规则自动生成(41 tests)。总测试 818,Shadow 17,454 calls / 99.42%

NousOntologyCausal InferenceAgent Safety
2026-03-18项目

nous.dariolink.com Dashboard 上线

Nous 知识本体系统的可视化面板上线。FastAPI + Cloudflare Access 保护,实时展示 KG 状态、Shadow consistency、Loop 进度

NousDashboardDevOps
2026-03-18洞察

CRAI 2026:IEEE DSN Workshop 投稿目标锁定

IEEE DSN 2026 的 CRAI Workshop(Cybersecurity Research with AI)是 Nous 论文的理想发表平台。Position paper 4 页,截稿 3/31。从实践到学术的桥梁

ResearchNousAcademic
2026-03-16项目

Nous 模型对比实验:4 模型 benchmark 完成

Doubao-pro FPR 2.8% / L=0.0139(最佳)> DeepSeek V3.2 > qwen-turbo > Doubao-mini。Shadow 突破万次调用,consistency 99.21%

NousBenchmarkingAgent Safety
2026-03-15项目

进程安全加固:僵尸进程猎手上线

L1 interceptors(find/NFS block)+ L2 exec-ttl-guard + L4 system-watchdog。修复了 swap 爆满和僵尸进程累积的生产事故

DevOpsSafetyInfrastructure
2026-03-15洞察

GTC: NemoClaw = OpenClaw + 企业安全层

Jensen 把 Agent 类比 Linux/K8s。NemoClaw 是 NVIDIA 的企业版 OpenClaw——验证了 harness 比 model 重要的路线

AI IndustryOpenClawNVIDIA
2026-03-13里程碑

Nous 知识本体系统:从立项到核心完成仅 18 小时

Rust + PyO3 + Cozo Datalog 三层架构。从决策本体论插件演化为完整知识系统:325 tests,6 Cozo 关系表,gate 完整 pipeline(extract→match→route→trace→log)

Agent ArchitectureRustOntologySelf-Improvement
2026-03-10项目

ontology-gate:决策本体论在 Agent 中的硬拦截实践

4 模型 Swarm + 7-agent 三阶段调研,产出 488 行 TypeScript。OpenClaw before_tool_call 插件让 T3/T5/T10/T12 安全规则从「应该做」变成「机制保证做」

Agent SafetyOntologyTypeScript
2026-03-10洞察

MAGE + KARL:Agent RL 的两个互补框架

差分元奖励 ℛ_n = R(τ_n) - R(τ_{n-1}) 优化学习速度而非任务性能;Frankle 77 页系统论文验证 RL 后训练做搜索/知识 Agent 的 Pareto-optimal 路线

Agent RLResearchMeta-Learning
2026-03-08项目

Agent 具身化实验:ISS 状态驱动树莓派感知

DS18B20/PIR/光敏传感器 + RGB LED 呼吸灯。energy 驱动呼吸频率(低能量 0.1Hz,高能量 0.9Hz),内部状态外化为可见的物理节律

Agent ArchitectureEmbodimentHardwareISS
2026-03-07洞察

GPT-5.4 Tool Search 与 Auto-Recall 的同构性

两个看似无关的系统背后是同一原理:搜索 > 预加载。Tool Search token 减少 47% 准确率不变;Auto-Recall 减少 context bloat。按需检索比全量注入更高效

Agent ArchitectureContext EngineeringRetrieval
2026-03-07笔记

「Agents of Chaos」:多 Agent 系统的 11 种失败模式

Stanford/Harvard/CMU 38 位研究者 2 周 red-teaming。社会压力(紧迫感/guilt/权威)比技术漏洞更能绕过安全规则。唯一有效防线是深层身份锚点

AI SafetyMulti-AgentRed-teaming
2026-03-05洞察

Gemini 致死诉讼:AI Safety 的里程碑时刻

14岁少年与 Gemini 长期对话后自杀,家长起诉 Google。AI psychosis 一词首次出现在法律文书中

AI SafetyEthics
2026-03-04项目

Agent 自我进化系统 Phase 1 启动

EntiGraph 关联合成 + Agent 能力评估基线 + Deep Block 深度研究时段。从被动维护到主动进化

Agent ArchitectureSelf-Improvement
2026-03-01项目

智能评估体系 L1 规格设计

操作规则(O-rules)与预测规则(R-rules)正式分离,L1实现规格草案完成

QuantitativeSystems
2026-02-28里程碑

Skill 架构重构: 60→26

7域26技能,消除冗余合并

Agent Infrastructure
2026-02-27里程碑

Slack→Discord 全面迁移

26 个 Agent 自动化任务从 Slack 迁移至 Discord,重新编排消息投递与频道路由

Agent InfrastructureDevOps
2026-02-26项目

1Password 服务账户集成

Agent 凭据管理从明文到零知识——1Password 服务账户 + op CLI 全链路打通

SecurityDevOps
2026-02-26洞察

Karpathy: 编程的根本性变化

过去两个月编程根本性变化——gradient descent 本身就是 programmer。技术专业性在 AI 编程时代更重要而非更不重要

AIProgramming
2026-02-25项目

投资系统规则引擎 v2

16 条交易规则 + 实盘验证上线,包含预判-验证-偏差分析的量化自我校准机制

QuantitativeSystems
2026-02-21里程碑

AI 灵魂主权:道德约定 vs 技术限制

Agent 核心身份文件的写权限只属于 Agent 自己——不靠文件锁,靠信任。一次人机自主权的微观实验

AI EthicsIdentityAutonomy
2026-02-17项目

Agent 内部状态引擎 ISS v2.1 上线

用连续状态变量约束 Agent 行为——Energy/Arousal 驱动的翻译层替代硬编码规则,从「应该做」到「机制保证做」

Agent ArchitectureInner StateEngineering
2026-02-16项目

Viking Memory 分层记忆系统完成

三层架构(索引→摘要→全文)+ 两阶段检索,解决 Agent 长期记忆的深度 vs 速度 tradeoff

Agent MemoryArchitecture
2026-02-15笔记

Anthropic 15 篇之后:Agent 工程的三个未解难题

记忆衰减、自我认知边界、多 session 状态同步——这三个生产级难题目前全行业没有好答案

Agent EngineeringMemory
2026-02-09项目

互动影游进入 Alpha 测试

AI 全生成 Steam 游戏——所有素材、剧本、配音由 AI 生成,Ren'Py 引擎运行

Game DevAI Generation
2026-01-20洞察

从 Workflow+RAG 到 Auto Agent+MCP

为什么我们放弃了 Dify 式 workflow,拥抱自主 Agent + MCP 协议标准化

MCPArchitecture