摘要:AI News & Strategy Daily 主理人 Nate B Jones 一人讲 38 分钟:装一个 agent 是 10 秒问题,让它干活是 40 小时问题;越资深的人越翻不出自己的工作流——所有 agent 公司都在卷错那一层。

原文:《The Real Problem With AI Agents Nobody's Talking About》
发布:2026-04-15
作者:YouTube — AI News & Strategy Daily 主理人
授权:未获明确授权,仅作学习交流,如有异议请联系删除

Nate B Jones on AI News & Strategy Daily

Nate B Jones——AI News & Strategy Daily 频道主理人,把过去几个月所有 -claw 系开源 agent 都装过一遍、把社区论坛留言翻了个底朝天后,独自录了 38 分钟脱口秀。他一气推到底的论点链:装 agent 是 10 秒问题,让它真正干活是 40 小时问题;那 40 小时的真名是"把你的工作翻译成 agent 听得懂的规格";而越资深的人越翻不出来——专家的判断早被压缩成只有自己看得懂的隐性判断;所以 2026 年所有 agent 公司都在卷错那一层。 最反共识的那条:你装的第一个 agent 不该是个人助理,应该是把你脑子里那本书印出来的采访员

原始视频:https://www.youtube.com/watch?v=2PWJu6uAaoU

要点速览

  • 装一个 agent 只需 10 秒,让它真正可用平均要 40 小时——后者才是结构性硬伤
  • Brad Mills 公开记录:花 40 小时写规范、转录 200 小时视频做知识库,最终"比管人还累"
  • 工作得起来的 agent 部署都长一个样——一组 markdown 文件(soul.md / identity.md / user.md / heartbeat.md)当 agent 的"操作系统"
  • 越资深的知识工作者越说不清自己怎么干活——这是 agent 落地的真正瓶颈
  • agent 第一次给个体一个自利的理由把隐性知识外化——过去几十年自上而下的 wiki 运动都失败了,因为收益归组织、成本归个人
  • 落地最有用的不是助手 agent,而是采访员 agent——结构化抽取你的隐性流程
  • Nate 自己的抽取工作流耗时最快 45 分钟,产物是结构化的"自我操作地图",配置文件只是副产品

1. 安装是 10 分钟问题,规格是 40 小时问题

Nate 一上来就把全场最尖锐的判断扔出来:agent 本身不会让你变高效,能让你高效的是你给 agent 的那份说明书。他承认那些"我用 agent 管 50 亿美元公司"的标题党故事大多数都是真的——但前提是有人花了大量时间把"我要做什么"翻译成 agent 能跑的语言。这一步在论坛里被消音了,所以普通用户装上之后第一反应是 “now what?"。

他给的对比很直白:安装是 10 分钟问题,规格是 40 小时问题。前者已经被一堆 -claw 产品卷到尽头,后者几乎没人在投资。这一句他说得比前面慢得多,几乎是把"40 hours"咬重音念出来。

具名案例是 Brad Mills——一位公开记录 OpenClaw 部署经验的从业者。40 小时写标准、定义"完成”、把 200 小时视频转录成可检索知识库,一次次失败之后比管一个人类下属还累——agent 经常很自信地报告任务完成,但实际上没做。Nate 把 Brad 定位为中位数体验,不是反例:

Brad 不是异常值。我会说他比那些承诺 10 倍效率的人更接近大多数人的真实体验。

Nate 顺手插了一句为什么 OpenClaw 在工程师圈先炸:开发者习惯被 PM 追问规格——“图片要在网页上这样显示?告诉我为什么、文件多大、加载多久、和其他元素怎么叠”——这种"逼问规格"的肌肉让他们写 markdown 配置时本能写得很细。普通人没有这个肌肉记忆,坐在配置界面前的本能反应是"我能少写一点吗?"——而这恰恰是把 40 小时变成 400 小时的开关。

注: Nate 在整期视频里反复用 “OpenClaw”、“NemoClaw”、“startclaw / myclaw / simpleclaw” 等 -claw 后缀作为代号,统称 2026 年这一波开源 agent 与套壳产品——这是 YouTube 创作者常用的修辞手法,不直呼真品牌名以避免被算法绑定到某家公司。本文整理时沿用 Nate 的代号习惯,不替换为真实产品名;涉及具名公司(Manus、Perplexity、Nvidia、Anthropic)的部分按 Nate 在视频里实际给出的描述照写。

2. 三个症状指向同一个空缺:49 美元配置包、套娃 agent、空挂权限

把 Brad 之外的论坛观察拼起来,Nate 给出三个具体症状。

第一个是市场症状:X 上有人卖 49 美元一份的预写配置包——soul.md + heartbeat.md + user.md 全套,营销话术是"帮你跳过 40 小时 OpenClaw 搭建"。他没多评论,但明显享受这个数据点:你能在"装好"和"能用"之间凿出一门小生意,本身就是 agent 行业的体检报告。

第二个是用户症状:一个论坛用户让 agent 写五版冷邮件文案,agent 回了 “done” 但什么都没生成;他后来不得不自建一个对抗式审计 agent 专门验证第一个 agent。Nate 把这种结构称为"套娃问题"——你需要监工监工监工,因为没有任何一层可以信任地自我汇报。

第三个是组织症状:另一位用户给团队全员发 OpenClaw 访问权限就当上线了——技术上跑通,实际上完全没用,因为没人提前梳理工作流和判断点。一个权限大、上下文空的 agent 挂上邮箱权限不是中性的——是带聊天接口的负担

三种症状指的是同一个空缺:能装上 agent 的人很多,能写出 agent 听得懂的规格的人几乎没有

3. 从 install 到 stick:还活着的 agent 都长一个样

讲完失败案例,Nate 把镜头拉到那些"几周几个月后还在用"的成功部署。判断很冷:和模型选择几乎无关,所有还活着的 agent 都长一个样。

打开任何一个稳态运行的 OpenClaw 目录,你会看到同一组文件骨架:soul.md 写角色、职责、语气和边界,本质就是岗位说明书;identity.md 写名字和个性约束;user.md 是非常细的人物画像,含偏好、作息、沟通风格;heartbeat.md 是一份每半小时跑一遍的检查清单——agent 自己问自己"现在该不该干点什么",再加一个简单 cron 把这套机制接到使用者真实作息上。

第二个共性是对记忆的投入。一种是原始 OpenClaw 路线——一个 memory.md 文件,agent 不断把新洞察追加进去;另一种是 Nate 自己社区里更流行的 open brain 路线——把记忆放进数据库,agent 通过查询拿回多维结构化洞察,长期更耐用。两者也可混用。

Nate 把这一段重复三次:这些东西都不是人工智能,全都是纯文本。但是这些纯文本的质量决定了你那个号称会动脑子的 agent 到底能不能干活。

注: Nate 反复提的 soul.md / heartbeat.md / user.md / identity.md 是 OpenClaw 类开源 agent 社区里逐渐固化下来的一组 markdown 配置文件命名——把 agent 的角色、个性约束、用户画像、定时检查清单分别写进不同的 .md,让 agent 在不同上下文里加载不同提示词。具体字段格式各社区版本不一,但"用一组 markdown 当 agent 操作系统"已经是事实标准。

4. 多 agent 系统:分工清楚才跑得通,不是模型选得对

那些"我有营销经理 agent + 调度 agent + 参谋长 agent"的演示,Nate 同样冷静:只有当每个 agent 拥有独立的 identity、独立的 markdown 文件、独立的工具集和工作区时,这种结构才成立。否则就是一个 agent 戴几顶帽子,上下文一锅炖。

他用工程语汇收口:关注点分离。Slack 里"专家 bot 之间互相委派、编排器决定谁接手"那种演示能不能跑,本质看这条边界画得清不清楚——预算审批的 bot 不能查 HR 数据、写文案的 bot 不该自己点投放。再聪明的通用规划器,临时拉起执行 agent 那条路也只在执行 agent 各自有清楚上下文时才走得通。所以"多 agent"不是把模型数量×N,是把指令清晰度×N

5. OpenClaw:Peter Steinberger 把难度故意留给用户

OpenClaw 是这一波的鼻祖,2026 年 GitHub 上 25 万星左右,本地运行、支持任意 LLM、能从 Telegram / WhatsApp / iMessage / Slack / 电话任意通道接管,免费、配置无上限。Nate 转述了一个关键设计意图:作者 Peter Steinberger 当初故意没把冷启动做容易——他不希望非开发者用 OpenClaw,因为非开发者很容易把它配成一个安全噩梦。OpenClaw 走红头一个月最显眼的舆情就是安全风险。

这个设计意图带来的副作用就是 OpenClaw 在工程师圈疯涨、在普通用户那边劝退——而 Nate 这一期视频要回答的问题正好夹在中间:当所有非开发者都想要一个 OpenClaw 时,他们撞上的第一堵墙不是安装,是写 markdown 这件事本身。把"能装"做容易了的产品很多,把"能写"做容易了的产品一个都没有。

注: Peter Steinberger 是德国程序员、PSPDFKit Inc.(业内广泛使用的 PDF 渲染 SDK)创始人,2023 年从 PSPDFKit CEO 位置退出后,活跃于 macOS 端的开发者 AI 工具圈,写过若干公开的 agent 配置脚本。Nate 视频里把他称为 OpenClaw 的设计者,本文沿用其叙述。

6. 五个对照组撞的是同一堵墙

OpenClaw 之后冒出来的产品 Nate 挨个过——不是给每家做测评,是点出它们撞的是同一堵墙

Manus(视频里他提"已被 Meta 收购")走桌面应用 + 云端虚拟机双轨,自动把查询拆成子 agent,10–15 分钟可上手——优化的是"敢敲第一句话",缺乏深度配置入口。

Perplexity Personal Computer 是这一波最大胆的赌:给每个用户一台真实 Mac Mini + 一个 PM AI 把任务路由到 20 个前沿模型——CEO Aravind Srinivas 在开发者大会上的口号是"传统 OS 接收指令,AI OS 接收目标"。Nate 同意 OpenClaw 在性质上确实是个操作系统,也同意它在为目标优化,但他立刻拐弯:目标后面紧跟着的是你的人生节奏、判断模式、操作习惯——硬件给你了,墙还是那堵墙。

NemoClaw 是 Nvidia 在 GTC 上由 Jensen Huang 亲自发布的企业级安全包装,沙盒、隐私护栏、Open Shell、Neotron 一应俱全——硬安全风险解得彻底,但 agent 操作说明该怎么写直接踢回给企业,而企业也不知道怎么写

Claude Dispatch 是 Anthropic 这一个月十几个发布里最显眼的——把手机和 Mac 配对、用任意消息应用控制 Claude,踩在一个软件行业 20 年没失手过的赌注上(人喜欢移动办公)。但 Nate 自己试过给一个不认识他的 agent 发 15 段 短信介绍自己,整堵文字墙,agent 仍然没接住。

startclaw / myclaw / simpleclaw 这一打托管套壳每周新冒一打,把"一键部署、预配置人设、托管基础设施"打磨得很顺——但他们卖的是别人的通用模板,让 agent 真正有用的恰恰是它够具体、够私人。

我用一个流行的 OpenClaw 类应用试过 15 段短信介绍自己。15 段。一整面墙的文字。它还是没明白。

每一家解决的都是真实问题,每一家解决的都是同一层(第一层)。第二层(规格)整个赛道空着——这是 Nate 给整个 2026 年 agent 产品格局的诊断书。

注: Perplexity AI 由 Aravind Srinivas 等四位联合创始人于 2022 年创立,最初做对话搜索,2024 年起推出 Comet 浏览器和 Pro 套餐,2025 年起加重企业方向。Nate 视频里描述的 Personal Computer 产品是其 2026 年开发者大会上对外展示的形态。

7. 越资深,操作系统越对自己不可见

讲到这里 Nate 把镜头从产品格局拉回到结构性诊断。他给了一个对所有知识工作者都成立的判断:你越资深、越值钱,你的工作就越多迁移到隐性判断上,而你自己的"操作系统"就越对你不可见。这不是失败,这是专业化的预期产物。

新手干活每一步都是显式的、有意识的;专家把所有步骤压缩成自动模式。Nate 打了个比方——你开车 20 年之后不会再思考"怎么右转",你就右转了。一个资深 PM 不会想"我应该先看营收看板再交叉看流失数据",他就开三个标签页扫一眼然后直接知道。如果你逼他把过程说出来,他会从结论倒推一段叙事,但那段叙事里漏掉了支撑结论的几百个微判断——而那几百个微判断,是几千小时积累出来的模式识别。

那个让你又快又准的能力,和让你的知识对外不可访问的能力,是同一件事。打比方说,它已经被从源代码编译成机器码,而你已经没有源代码了。

8. 委派、晋升、知识蒸发:三个组织级老问题

Nate 把这条结构性诊断与三个组织级老问题串起来:委派失败——管理者总被骂控制狂,真实原因是他们说不清自己脑子里那套东西;强 IC 升不上去——不是不够格,而是他们太不可替代,没人敢冒"丢掉这块业务"的险;人离职,组织知识蒸发——一个人走了,那套压缩在他头里的东西就消失了。

这三件事公司过去几十年都在尝试用"把你的知识外化"运动来解——HR 推过、咨询顾问推过、CEO 在年会上推过,全部失败。失败原因 Nate 说得很重:收益归组织、成本归个人,写 wiki 的人输了。这就是为什么自上而下的知识管理永远走不通。

9. agent 颠倒文档化激励:第一个写下来的人是赢家

agent 在结构上颠倒了这个激励——写下你工作方式的第一个人,是第一个拿到杠杆的人,组织只是次级受益者。这是一个典型的"自下而上知识管理革命,伪装成消费 AI 产品"的判断。Nate 顺势抱怨:大多数 agent 公司自己都没意识到这一点,否则它们的上手流程不会做得那么轻——他试过六七家,每一家的开场都太薄

如果 agent 的价值依赖你能不能把工作讲清楚,Nate 的推论是:职场会很快裂出一道极其可见的鸿沟——花时间把专业拆成可委派组件的人拿到复利(第二个 agent 比第一个起得快、第十个几分钟就上线),跳过这一步的人装好玩一个周末撞墙、断言"agent 就是泡沫"。Nate 加了一句:他们错了,agent 没问题,问题从来不在 agent

10. 第一个 agent 不该是助手,是采访员

到这里 Nate 才把他自己的解法亮出来,反共识到几乎像在挑衅:你装的第一个 agent 不应该是个人助理,不应该是参谋长,不应该是邮箱整理员、调度员、简报 bot——应该是一个采访员,一个专门把你脑子里那点操作知识套问出来的 agent。

这不是 OpenClaw 上来问的"你是谁、我是谁、我的工作是什么"那三个套话——深度差出几个数量级。他承认这是一个"专家知识抽取研究员"的活——“是的,这是一个真实存在的职业”——把这种角色做进 agent,再把它做成第一个用户接触的产品,这一步 Nate 没看到任何一家在做。

你装的第一个 agent 不应该是你的个人助理,应该是为’让你能用 agent’而做准备的工具。

11. 5 层抽取:配置文件是副产品,结构化自我地图才是资产

Nate 公开了他自己在做的工具的结构——一个走五层的结构化抽取工作流:

  1. 工作节奏——你一天、一周、一个月真实的样子,不是日历上的版本,是真实的版本
  2. 重复决策——你反复在做的判断,容易判断的、难判断的
  3. 输入 / 依赖——你需要谁给你什么、什么时候给(这一层他特别强调几乎没有 agent 在问)
  4. 摩擦点——重复消耗你时间的烦躁来源

Nate 开口说的是"五层",但视频里他只完整列出上述 4 层就跳到"这要花时间"——第 5 层在这版录制里没说出来

他主动承认这要花时间——他自己跑下来"最快 45 分钟,可能更长",是这期视频里最直白的"我也不打包票"瞬间。工作流跑完会自动生成 soul.md + heartbeat.md + user.md 这套配置——“直接接进一个 OpenClaw 就能用”。但 Nate 把价值排序倒过来:配置文件是最不有趣的产物。真正值钱的是过程本身——你被一个 agent 用结构化方式问完一遍之后,你拥有了一份关于自己怎么工作的可搜索数据库

这份数据库塞进任意一个个人知识库(他把这种轻量后端叫 open brain,每月运行成本"大概 10 美分"),从此对所有 MCP 接入的 agent 都可见。结果不只是 agent 变好用——你委派给人也变好了,被升职变容易了,离职后专业不会蒸发了。

Q&A 速览

Q| 装一个 OpenClaw 真的只要 10 秒吗?

A| Nate 说"等我把这句话说完它就跑起来了"——安装已经是标配,他甚至把这句话当作整期开场。重点从来不是安装。

Q| 那为什么这么多人卡住?

A| 因为安装之后没有任何人教你怎么把"我自己怎么工作"翻译成 agent 听得懂的规格——这是一个 40 小时起步的活,且没有任何 agent 公司在帮你

Q| Anthropic、Perplexity、Nvidia、Manus 都白干了吗?

A| 不是白干。它们解决的安装 / 安全 / 移动控制是真实问题,但都属于第一层。第二层(规格)整个赛道空着——所有产品都撞同一堵墙。

Q| 什么是 open brain?

A| Nate 自己社区里固化下来的轻量个人知识库后端,每月运行成本"大概 10 美分"。把跑完 5 层抽取拿到的结构化数据塞进去,从此对所有 MCP 接入的 agent 都可见。Nate 给的价值排序很反共识——配置文件是副产品,这个数据库才是真正的资产