AI agent 真正的问题没人愿意谈

摘要：AI News & Strategy Daily 主理人 Nate B Jones 一人讲 38 分钟：装一个 agent 是 10 秒问题，让它干活是 40 小时问题；越资深的人越翻不出自己的工作流——所有 agent 公司都在卷错那一层。

原文：《The Real Problem With AI Agents Nobody's Talking About》

发布：2026-04-15

作者：Nate B Jones — AI News & Strategy Daily 主理人

授权：未获明确授权，仅作学习交流，如有异议请联系删除

Nate B Jones on AI News & Strategy Daily

Nate B Jones——AI News & Strategy Daily 频道主理人，把过去几个月所有 -claw 系开源 agent 都装过一遍、把社区论坛留言翻了个底朝天后，独自录了 38 分钟脱口秀。他一气推到底的论点链：装 agent 是 10 秒问题，让它真正干活是 40 小时问题；那 40 小时的真名是"把你的工作翻译成 agent 听得懂的规格"；而越资深的人越翻不出来——专家的判断早被压缩成只有自己看得懂的隐性判断；所以 2026 年所有 agent 公司都在卷错那一层。最反共识的那条：你装的第一个 agent 不该是个人助理，应该是把你脑子里那本书印出来的采访员。

原始视频：https://www.youtube.com/watch?v=2PWJu6uAaoU

要点速览

装一个 agent 只需 10 秒，让它真正可用平均要 40 小时——后者才是结构性硬伤
Brad Mills 公开记录：花 40 小时写规范、转录 200 小时视频做知识库，最终"比管人还累"
工作得起来的 agent 部署都长一个样——一组 markdown 文件（soul.md / identity.md / user.md / heartbeat.md）当 agent 的"操作系统"
越资深的知识工作者越说不清自己怎么干活——这是 agent 落地的真正瓶颈
agent 第一次给个体一个自利的理由把隐性知识外化——过去几十年自上而下的 wiki 运动都失败了，因为收益归组织、成本归个人
落地最有用的不是助手 agent，而是采访员 agent——结构化抽取你的隐性流程
Nate 自己的抽取工作流耗时最快 45 分钟，产物是结构化的"自我操作地图"，配置文件只是副产品

1. 安装是 10 分钟问题，规格是 40 小时问题

Nate 一上来就把全场最尖锐的判断扔出来：agent 本身不会让你变高效，能让你高效的是你给 agent 的那份说明书。他承认那些"我用 agent 管 50 亿美元公司"的标题党故事大多数都是真的——但前提是有人花了大量时间把"我要做什么"翻译成 agent 能跑的语言。这一步在论坛里被消音了，所以普通用户装上之后第一反应是 “now what?"。

他给的对比很直白：安装是 10 分钟问题，规格是 40 小时问题。前者已经被一堆 -claw 产品卷到尽头，后者几乎没人在投资。这一句他说得比前面慢得多，几乎是把"40 hours"咬重音念出来。

具名案例是 Brad Mills——一位公开记录 OpenClaw 部署经验的从业者。40 小时写标准、定义"完成”、把 200 小时视频转录成可检索知识库，一次次失败之后比管一个人类下属还累——agent 经常很自信地报告任务完成，但实际上没做。Nate 把 Brad 定位为中位数体验，不是反例：

Brad 不是异常值。我会说他比那些承诺 10 倍效率的人更接近大多数人的真实体验。

Nate 顺手插了一句为什么 OpenClaw 在工程师圈先炸：开发者习惯被 PM 追问规格——“图片要在网页上这样显示？告诉我为什么、文件多大、加载多久、和其他元素怎么叠”——这种"逼问规格"的肌肉让他们写 markdown 配置时本能写得很细。普通人没有这个肌肉记忆，坐在配置界面前的本能反应是"我能少写一点吗？"——而这恰恰是把 40 小时变成 400 小时的开关。

注： Nate 在整期视频里反复用 “OpenClaw”、“NemoClaw”、“startclaw / myclaw / simpleclaw” 等 -claw 后缀作为代号，统称 2026 年这一波开源 agent 与套壳产品——这是 YouTube 创作者常用的修辞手法，不直呼真品牌名以避免被算法绑定到某家公司。本文整理时沿用 Nate 的代号习惯，不替换为真实产品名；涉及具名公司（Manus、Perplexity、Nvidia、Anthropic）的部分按 Nate 在视频里实际给出的描述照写。

2. 三个症状指向同一个空缺：49 美元配置包、套娃 agent、空挂权限

把 Brad 之外的论坛观察拼起来，Nate 给出三个具体症状。

第一个是市场症状：X 上有人卖 49 美元一份的预写配置包——soul.md + heartbeat.md + user.md 全套，营销话术是"帮你跳过 40 小时 OpenClaw 搭建"。他没多评论，但明显享受这个数据点：你能在"装好"和"能用"之间凿出一门小生意，本身就是 agent 行业的体检报告。

第二个是用户症状：一个论坛用户让 agent 写五版冷邮件文案，agent 回了 “done” 但什么都没生成；他后来不得不自建一个对抗式审计 agent 专门验证第一个 agent。Nate 把这种结构称为"套娃问题"——你需要监工监工监工，因为没有任何一层可以信任地自我汇报。

第三个是组织症状：另一位用户给团队全员发 OpenClaw 访问权限就当上线了——技术上跑通，实际上完全没用，因为没人提前梳理工作流和判断点。一个权限大、上下文空的 agent 挂上邮箱权限不是中性的——是带聊天接口的负担。

三种症状指的是同一个空缺：能装上 agent 的人很多，能写出 agent 听得懂的规格的人几乎没有。

3. 从 install 到 stick：还活着的 agent 都长一个样

讲完失败案例，Nate 把镜头拉到那些"几周几个月后还在用"的成功部署。判断很冷：和模型选择几乎无关，所有还活着的 agent 都长一个样。

打开任何一个稳态运行的 OpenClaw 目录，你会看到同一组文件骨架：soul.md 写角色、职责、语气和边界，本质就是岗位说明书；identity.md 写名字和个性约束；user.md 是非常细的人物画像，含偏好、作息、沟通风格；heartbeat.md 是一份每半小时跑一遍的检查清单——agent 自己问自己"现在该不该干点什么"，再加一个简单 cron 把这套机制接到使用者真实作息上。

第二个共性是对记忆的投入。一种是原始 OpenClaw 路线——一个 memory.md 文件，agent 不断把新洞察追加进去；另一种是 Nate 自己社区里更流行的 open brain 路线——把记忆放进数据库，agent 通过查询拿回多维结构化洞察，长期更耐用。两者也可混用。

Nate 把这一段重复三次：这些东西都不是人工智能，全都是纯文本。但是这些纯文本的质量决定了你那个号称会动脑子的 agent 到底能不能干活。

注： Nate 反复提的 soul.md / heartbeat.md / user.md / identity.md 是 OpenClaw 类开源 agent 社区里逐渐固化下来的一组 markdown 配置文件命名——把 agent 的角色、个性约束、用户画像、定时检查清单分别写进不同的 .md，让 agent 在不同上下文里加载不同提示词。具体字段格式各社区版本不一，但"用一组 markdown 当 agent 操作系统"已经是事实标准。

4. 多 agent 系统：分工清楚才跑得通，不是模型选得对

那些"我有营销经理 agent + 调度 agent + 参谋长 agent"的演示，Nate 同样冷静：只有当每个 agent 拥有独立的 identity、独立的 markdown 文件、独立的工具集和工作区时，这种结构才成立。否则就是一个 agent 戴几顶帽子，上下文一锅炖。

他用工程语汇收口：关注点分离。Slack 里"专家 bot 之间互相委派、编排器决定谁接手"那种演示能不能跑，本质看这条边界画得清不清楚——预算审批的 bot 不能查 HR 数据、写文案的 bot 不该自己点投放。再聪明的通用规划器，临时拉起执行 agent 那条路也只在执行 agent 各自有清楚上下文时才走得通。所以"多 agent"不是把模型数量×N，是把指令清晰度×N。

5. OpenClaw：Peter Steinberger 把难度故意留给用户

OpenClaw 是这一波的鼻祖，2026 年 GitHub 上 25 万星左右，本地运行、支持任意 LLM、能从 Telegram / WhatsApp / iMessage / Slack / 电话任意通道接管，免费、配置无上限。Nate 转述了一个关键设计意图：作者 Peter Steinberger 当初故意没把冷启动做容易——他不希望非开发者用 OpenClaw，因为非开发者很容易把它配成一个安全噩梦。OpenClaw 走红头一个月最显眼的舆情就是安全风险。

这个设计意图带来的副作用就是 OpenClaw 在工程师圈疯涨、在普通用户那边劝退——而 Nate 这一期视频要回答的问题正好夹在中间：当所有非开发者都想要一个 OpenClaw 时，他们撞上的第一堵墙不是安装，是写 markdown 这件事本身。把"能装"做容易了的产品很多，把"能写"做容易了的产品一个都没有。

注： Peter Steinberger 是德国程序员、PSPDFKit Inc.（业内广泛使用的 PDF 渲染 SDK）创始人，2023 年从 PSPDFKit CEO 位置退出后，活跃于 macOS 端的开发者 AI 工具圈，写过若干公开的 agent 配置脚本。Nate 视频里把他称为 OpenClaw 的设计者，本文沿用其叙述。

6. 五个对照组撞的是同一堵墙

OpenClaw 之后冒出来的产品 Nate 挨个过——不是给每家做测评，是点出它们撞的是同一堵墙。

Manus（视频里他提"已被 Meta 收购"）走桌面应用 + 云端虚拟机双轨，自动把查询拆成子 agent，10–15 分钟可上手——优化的是"敢敲第一句话"，缺乏深度配置入口。

Perplexity Personal Computer 是这一波最大胆的赌：给每个用户一台真实 Mac Mini + 一个 PM AI 把任务路由到 20 个前沿模型——CEO Aravind Srinivas 在开发者大会上的口号是"传统 OS 接收指令，AI OS 接收目标"。Nate 同意 OpenClaw 在性质上确实是个操作系统，也同意它在为目标优化，但他立刻拐弯：目标后面紧跟着的是你的人生节奏、判断模式、操作习惯——硬件给你了，墙还是那堵墙。

NemoClaw 是 Nvidia 在 GTC 上由 Jensen Huang 亲自发布的企业级安全包装，沙盒、隐私护栏、Open Shell、Neotron 一应俱全——硬安全风险解得彻底，但 agent 操作说明该怎么写直接踢回给企业，而企业也不知道怎么写。

Claude Dispatch 是 Anthropic 这一个月十几个发布里最显眼的——把手机和 Mac 配对、用任意消息应用控制 Claude，踩在一个软件行业 20 年没失手过的赌注上（人喜欢移动办公）。但 Nate 自己试过给一个不认识他的 agent 发 15 段 短信介绍自己，整堵文字墙，agent 仍然没接住。

startclaw / myclaw / simpleclaw 这一打托管套壳每周新冒一打，把"一键部署、预配置人设、托管基础设施"打磨得很顺——但他们卖的是别人的通用模板，让 agent 真正有用的恰恰是它够具体、够私人。

我用一个流行的 OpenClaw 类应用试过 15 段短信介绍自己。15 段。一整面墙的文字。它还是没明白。

每一家解决的都是真实问题，每一家解决的都是同一层（第一层）。第二层（规格）整个赛道空着——这是 Nate 给整个 2026 年 agent 产品格局的诊断书。

注： Perplexity AI 由 Aravind Srinivas 等四位联合创始人于 2022 年创立，最初做对话搜索，2024 年起推出 Comet 浏览器和 Pro 套餐，2025 年起加重企业方向。Nate 视频里描述的 Personal Computer 产品是其 2026 年开发者大会上对外展示的形态。

7. 越资深，操作系统越对自己不可见

讲到这里 Nate 把镜头从产品格局拉回到结构性诊断。他给了一个对所有知识工作者都成立的判断：你越资深、越值钱，你的工作就越多迁移到隐性判断上，而你自己的"操作系统"就越对你不可见。这不是失败，这是专业化的预期产物。

新手干活每一步都是显式的、有意识的；专家把所有步骤压缩成自动模式。Nate 打了个比方——你开车 20 年之后不会再思考"怎么右转"，你就右转了。一个资深 PM 不会想"我应该先看营收看板再交叉看流失数据"，他就开三个标签页扫一眼然后直接知道。如果你逼他把过程说出来，他会从结论倒推一段叙事，但那段叙事里漏掉了支撑结论的几百个微判断——而那几百个微判断，是几千小时积累出来的模式识别。

那个让你又快又准的能力，和让你的知识对外不可访问的能力，是同一件事。打比方说，它已经被从源代码编译成机器码，而你已经没有源代码了。

8. 委派、晋升、知识蒸发：三个组织级老问题

Nate 把这条结构性诊断与三个组织级老问题串起来：委派失败——管理者总被骂控制狂，真实原因是他们说不清自己脑子里那套东西；强 IC 升不上去——不是不够格，而是他们太不可替代，没人敢冒"丢掉这块业务"的险；人离职，组织知识蒸发——一个人走了，那套压缩在他头里的东西就消失了。

这三件事公司过去几十年都在尝试用"把你的知识外化"运动来解——HR 推过、咨询顾问推过、CEO 在年会上推过，全部失败。失败原因 Nate 说得很重：收益归组织、成本归个人，写 wiki 的人输了。这就是为什么自上而下的知识管理永远走不通。

9. agent 颠倒文档化激励：第一个写下来的人是赢家

agent 在结构上颠倒了这个激励——写下你工作方式的第一个人，是第一个拿到杠杆的人，组织只是次级受益者。这是一个典型的"自下而上知识管理革命，伪装成消费 AI 产品"的判断。Nate 顺势抱怨：大多数 agent 公司自己都没意识到这一点，否则它们的上手流程不会做得那么轻——他试过六七家，每一家的开场都太薄。

如果 agent 的价值依赖你能不能把工作讲清楚，Nate 的推论是：职场会很快裂出一道极其可见的鸿沟——花时间把专业拆成可委派组件的人拿到复利（第二个 agent 比第一个起得快、第十个几分钟就上线），跳过这一步的人装好玩一个周末撞墙、断言"agent 就是泡沫"。Nate 加了一句：他们错了，agent 没问题，问题从来不在 agent。

10. 第一个 agent 不该是助手，是采访员

到这里 Nate 才把他自己的解法亮出来，反共识到几乎像在挑衅：你装的第一个 agent 不应该是个人助理，不应该是参谋长，不应该是邮箱整理员、调度员、简报 bot——应该是一个采访员，一个专门把你脑子里那点操作知识套问出来的 agent。

这不是 OpenClaw 上来问的"你是谁、我是谁、我的工作是什么"那三个套话——深度差出几个数量级。他承认这是一个"专家知识抽取研究员"的活——“是的，这是一个真实存在的职业”——把这种角色做进 agent，再把它做成第一个用户接触的产品，这一步 Nate 没看到任何一家在做。

你装的第一个 agent 不应该是你的个人助理，应该是为’让你能用 agent’而做准备的工具。

11. 5 层抽取：配置文件是副产品，结构化自我地图才是资产

Nate 公开了他自己在做的工具的结构——一个走五层的结构化抽取工作流：

工作节奏——你一天、一周、一个月真实的样子，不是日历上的版本，是真实的版本
重复决策——你反复在做的判断，容易判断的、难判断的
输入 / 依赖——你需要谁给你什么、什么时候给（这一层他特别强调几乎没有 agent 在问）
摩擦点——重复消耗你时间的烦躁来源

Nate 开口说的是"五层"，但视频里他只完整列出上述 4 层就跳到"这要花时间"——第 5 层在这版录制里没说出来。

他主动承认这要花时间——他自己跑下来"最快 45 分钟，可能更长"，是这期视频里最直白的"我也不打包票"瞬间。工作流跑完会自动生成 soul.md + heartbeat.md + user.md 这套配置——“直接接进一个 OpenClaw 就能用”。但 Nate 把价值排序倒过来：配置文件是最不有趣的产物。真正值钱的是过程本身——你被一个 agent 用结构化方式问完一遍之后，你拥有了一份关于自己怎么工作的可搜索数据库。

这份数据库塞进任意一个个人知识库（他把这种轻量后端叫 open brain，每月运行成本"大概 10 美分"），从此对所有 MCP 接入的 agent 都可见。结果不只是 agent 变好用——你委派给人也变好了，被升职变容易了，离职后专业不会蒸发了。

Q&A 速览

Q｜装一个 OpenClaw 真的只要 10 秒吗？

A｜ Nate 说"等我把这句话说完它就跑起来了"——安装已经是标配，他甚至把这句话当作整期开场。重点从来不是安装。

Q｜那为什么这么多人卡住？

A｜因为安装之后没有任何人教你怎么把"我自己怎么工作"翻译成 agent 听得懂的规格——这是一个 40 小时起步的活，且没有任何 agent 公司在帮你。

Q｜ Anthropic、Perplexity、Nvidia、Manus 都白干了吗？

A｜不是白干。它们解决的安装 / 安全 / 移动控制是真实问题，但都属于第一层。第二层（规格）整个赛道空着——所有产品都撞同一堵墙。

Q｜什么是 open brain？

A｜ Nate 自己社区里固化下来的轻量个人知识库后端，每月运行成本"大概 10 美分"。把跑完 5 层抽取拿到的结构化数据塞进去，从此对所有 MCP 接入的 agent 都可见。Nate 给的价值排序很反共识——配置文件是副产品，这个数据库才是真正的资产。

要点速览#

1. 安装是 10 分钟问题，规格是 40 小时问题#

2. 三个症状指向同一个空缺：49 美元配置包、套娃 agent、空挂权限#

3. 从 install 到 stick：还活着的 agent 都长一个样#

4. 多 agent 系统：分工清楚才跑得通，不是模型选得对#

5. OpenClaw：Peter Steinberger 把难度故意留给用户#

6. 五个对照组撞的是同一堵墙#

7. 越资深，操作系统越对自己不可见#

8. 委派、晋升、知识蒸发：三个组织级老问题#

9. agent 颠倒文档化激励：第一个写下来的人是赢家#

10. 第一个 agent 不该是助手，是采访员#

11. 5 层抽取：配置文件是副产品，结构化自我地图才是资产#

Q&A 速览#