2026 年 6 月 17 日,Pawel Jozefiak 在 Digital Thoughts 上发表了一篇值得一读的文章:“I Trust My Car More Than My AI Agent. Here Is Why.”
作者自己构建并日常使用 AI 代理,他坦诚地描述了这种矛盾心态:
“我的代理让我高效了很多。它也让我不得不更盯紧它。这两件事都是真的,我决定不再假装第二件事不存在。”
这篇文章不是 AI 功能清单,也不是对未来的盲目乐观——它是在问一个很少有人认真追问的问题:为什么我们愿意让汽车在高速上自动驾驶,却不敢让 AI 代理独立处理一封邮件?
信任是一个里程问题
作者用一个简单的类比开篇:他开车约十万公里后,信任是自然建立的——他知道车在冷早晨会有什么小毛病,能预测车的反应范围。信任 = 重复 + 可预测的结果。
但对于 AI 代理,这个公式只对了一半。
| 汽车 | AI 代理 | |
|---|---|---|
| 信任基础 | 十万公里的重复 | 任务不同,无法重复 |
| 故障范围 | 已知且有限(爆胎、电瓶没电) | 未知且开放(抓错上下文、调用错工具) |
| 可预测性 | 高,熟悉所有边界 | 低,尤其开放任务时像黑箱 |
| 失败模式 | 可诊断(引擎灯、异响) | 静默失败(tool call 失败但不报错) |
确定性获得信任,代理性带来黑箱
作者提炼出一个关键模式:
任务越确定,信任越快。任务越代理化(agentic),越像在看黑箱。
- 一个每晚重命名相同文件的脚本——几个月前就不再关注了。无聊就是重点。
- 一个开放式的多步骤任务——需要判断、需要从错误中恢复——结果分散,预测困难。
这些不是理论上的吐槽。作者列举了每个 AI 代理构建者都在打的仗:
- 上下文限制——窗口有限,长任务中间会断
- 记忆不持久——不像人一样能真正累积经验
- 检索错误——在关键时刻抓错了文档
- 工具调用静默失败——Agent 卡住了但不知道自己卡住了
“这些限制没有一个是永久的。过去一年里我亲眼看着它们在跳跃式进步——从不在一个整齐的时间表上。这个细节对接下来的一切都很重要。”
如果拉长镜头看
入口斜坡(On-ramp)是缺失的拼图
作者认为现状是:大多数人”用 AI”等于一个聊天窗口,大多数公司”用 AI”属于那 88% 几乎没什么可展示的。能力就在那里,缺少的是让普通人上手的入口。
他特别提到苹果在 WWDC 上的 Siri 改造——基于 Google Gemini 构建的代理层,能链式处理多步骤任务,通过 App Store 集成可以预约餐厅、控制智能家居。评论很直接:
“连苹果都决定原始模型正在成为大宗商品,产品是站在上面的助手。把代理放在普通用户面前,这就是全部的游戏。”
每个人都用代理时,互联网会变
作者提出了一个很少被讨论的后果:当几亿人的代理在互联网上并行运行时,流量会从人类浏览转变为机器浏览。他的代理在一小时内触及的网页比他一天还多。
这带来物理世界的成本:
- 推理已占今年所有 AI 算力的约 2/3(2023 年是 1/3)
- 数据中心用电量年增长双位数百分比
- GPU 价格不会下降
“我估计优质 AI 的成本在下降之前还会先上涨一段,因为需求比供应涨得快,而电力和芯片是真实有限的。”
因此他坚持在廉价 Mac mini 上跑本地模型,即使更慢更笨。他想给自己一个不随市场波动的底线。
工作问题
“它到底会不会抢走工作?这就是藏在所有其他问题下面的那个真正的问题。”
作者引用世界经济论坛的预测:到 2030 年,新增约 1.7 亿 个岗位,消失约 9200 万 个,净增约 7800 万,但约 1/5 的工作会改变形态。
“净增对消失的那 9200 万人来说是冰冷的安慰。这场革命要求人们从一种工作迁移到另一种,而人们不可能以同样的速度迁移。”
他的结论是:擅长指挥 AI 的人会赢。跟它赛跑是输家的游戏。
物理世界的半场更慢
“数字世界的一切——一个屏幕上的个人助理——近在眼前。但任何需要物理身体的事情……身体才是难的部分。”
作者给出了他对机器人落地的时间估计:
| 公司 | 产品 | 时间线 |
|---|---|---|
| 1X | NEO 家庭机器人 | 2026 年发货美国,$20,000 或 $500/月 |
| Figure | 工厂机器人(BMW 产线) | 已在运作 |
| Tesla | Optimus | 改造汽车工厂中 |
| 真正有用的家用机器人 | — | 2028-2032 |
“这不是科幻了,已经近到让我开始思考。”
我们还处在狂野西部
文章最后回到一个深层的观察。上周,美国政府要求 Anthropic 在全球范围内下架了两个前沿模型(Fable 5 和 Mythos 5),因为出口管制——不能仅按国籍过滤,所以对整个地球关闭了。
“坐下想一下。政府把一段软件视为足够危险的东西,来控制谁可以碰它。没人以这种方式控制自动补全。这就是信号——这些工具已经强到要被当作危险物品来监管,而大多数本可以把它们用得很好的人还没意识到这一点。”
几点感想
这篇文章最打动我的不是它的结论,而是它的诚实。作者既不是 AI 吹鼓手,也不是怀疑论者。他是一个每天在用 AI 代理、也同时被 AI 代理坑过的人。他的立场是审慎乐观(pragmatically optimistic)。
他说的那句”确定性获得信任,代理性带来黑箱“,可能是理解当前 AI 代理信任困境最好的概括。各种”AI 信任框架”和”可解释 AI”方法论,都试图解决这个黑箱问题——但真正能建立信任的,可能不是更漂亮的可视化仪表盘,而是让代理在某些任务上跑够十万公里。
参考资料
- 原文:I Trust My Car More Than My AI Agent. Here Is Why. — 作者 Pawel Jozefiak(2026-06-17)
- 作者的其他相关文章:Bounded Agent、Self-improving Agent、Skills That Hold Their Value
- 世界经济论坛就业预测(引用)
- Apple WWDC 2026 Siri 改造公告
文档信息
- 本文作者:zhupite
- 本文链接:https://zhupite.com/reads/trust-car-more-than-ai-agent.html
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)