「我更信任我的车,而不是我的 AI 代理」——信任瓶颈与 AI 代理的未来

2026/06/18 reads AI Agent · 信任机制 · AI代理 · 可信AI · 自动化 · 机器人 · Apple · Siri 2264 字 · 约 7 分钟 阅读 ...
Pawel Jozefiak 发表了一篇关于 AI 代理信任问题的深度思考:为什么人们愿意相信汽车可以安全行驶十万公里,却不敢让 AI 代理独立运行一小时?信任不是技术问题,是里程问题。文章也探讨了苹果 Siri 的 Gemini 改造、机器人落地时间线、以及 AI 时代的就业变局。

2026 年 6 月 17 日,Pawel Jozefiak 在 Digital Thoughts 上发表了一篇值得一读的文章:“I Trust My Car More Than My AI Agent. Here Is Why.”

作者自己构建并日常使用 AI 代理,他坦诚地描述了这种矛盾心态:

“我的代理让我高效了很多。它也让我不得不更盯紧它。这两件事都是真的,我决定不再假装第二件事不存在。”

这篇文章不是 AI 功能清单,也不是对未来的盲目乐观——它是在问一个很少有人认真追问的问题:为什么我们愿意让汽车在高速上自动驾驶,却不敢让 AI 代理独立处理一封邮件?


信任是一个里程问题

作者用一个简单的类比开篇:他开车约十万公里后,信任是自然建立的——他知道车在冷早晨会有什么小毛病,能预测车的反应范围。信任 = 重复 + 可预测的结果

但对于 AI 代理,这个公式只对了一半。

 汽车AI 代理
信任基础十万公里的重复任务不同,无法重复
故障范围已知且有限(爆胎、电瓶没电)未知且开放(抓错上下文、调用错工具)
可预测性高,熟悉所有边界低,尤其开放任务时像黑箱
失败模式可诊断(引擎灯、异响)静默失败(tool call 失败但不报错)

确定性获得信任,代理性带来黑箱

作者提炼出一个关键模式:

任务越确定,信任越快。任务越代理化(agentic),越像在看黑箱。

  • 一个每晚重命名相同文件的脚本——几个月前就不再关注了。无聊就是重点。
  • 一个开放式的多步骤任务——需要判断、需要从错误中恢复——结果分散,预测困难。

这些不是理论上的吐槽。作者列举了每个 AI 代理构建者都在打的仗:

  • 上下文限制——窗口有限,长任务中间会断
  • 记忆不持久——不像人一样能真正累积经验
  • 检索错误——在关键时刻抓错了文档
  • 工具调用静默失败——Agent 卡住了但不知道自己卡住了

“这些限制没有一个是永久的。过去一年里我亲眼看着它们在跳跃式进步——从不在一个整齐的时间表上。这个细节对接下来的一切都很重要。”


如果拉长镜头看

入口斜坡(On-ramp)是缺失的拼图

作者认为现状是:大多数人”用 AI”等于一个聊天窗口,大多数公司”用 AI”属于那 88% 几乎没什么可展示的。能力就在那里,缺少的是让普通人上手的入口

他特别提到苹果在 WWDC 上的 Siri 改造——基于 Google Gemini 构建的代理层,能链式处理多步骤任务,通过 App Store 集成可以预约餐厅、控制智能家居。评论很直接:

“连苹果都决定原始模型正在成为大宗商品,产品是站在上面的助手。把代理放在普通用户面前,这就是全部的游戏。”

每个人都用代理时,互联网会变

作者提出了一个很少被讨论的后果:当几亿人的代理在互联网上并行运行时,流量会从人类浏览转变为机器浏览。他的代理在一小时内触及的网页比他一天还多。

这带来物理世界的成本:

  • 推理已占今年所有 AI 算力的约 2/3(2023 年是 1/3)
  • 数据中心用电量年增长双位数百分比
  • GPU 价格不会下降

“我估计优质 AI 的成本在下降之前还会先上涨一段,因为需求比供应涨得快,而电力和芯片是真实有限的。”

因此他坚持在廉价 Mac mini 上跑本地模型,即使更慢更笨。他想给自己一个不随市场波动的底线。


工作问题

“它到底会不会抢走工作?这就是藏在所有其他问题下面的那个真正的问题。”

作者引用世界经济论坛的预测:到 2030 年,新增约 1.7 亿 个岗位,消失约 9200 万 个,净增约 7800 万,但约 1/5 的工作会改变形态

“净增对消失的那 9200 万人来说是冰冷的安慰。这场革命要求人们从一种工作迁移到另一种,而人们不可能以同样的速度迁移。”

他的结论是:擅长指挥 AI 的人会赢。跟它赛跑是输家的游戏。


物理世界的半场更慢

“数字世界的一切——一个屏幕上的个人助理——近在眼前。但任何需要物理身体的事情……身体才是难的部分。”

作者给出了他对机器人落地的时间估计:

公司产品时间线
1XNEO 家庭机器人2026 年发货美国,$20,000 或 $500/月
Figure工厂机器人(BMW 产线)已在运作
TeslaOptimus改造汽车工厂中
真正有用的家用机器人2028-2032

“这不是科幻了,已经近到让我开始思考。”


我们还处在狂野西部

文章最后回到一个深层的观察。上周,美国政府要求 Anthropic 在全球范围内下架了两个前沿模型(Fable 5 和 Mythos 5),因为出口管制——不能仅按国籍过滤,所以对整个地球关闭了。

“坐下想一下。政府把一段软件视为足够危险的东西,来控制谁可以碰它。没人以这种方式控制自动补全。这就是信号——这些工具已经强到要被当作危险物品来监管,而大多数本可以把它们用得很好的人还没意识到这一点。”


几点感想

这篇文章最打动我的不是它的结论,而是它的诚实。作者既不是 AI 吹鼓手,也不是怀疑论者。他是一个每天在用 AI 代理、也同时被 AI 代理坑过的人。他的立场是审慎乐观(pragmatically optimistic)

他说的那句”确定性获得信任,代理性带来黑箱“,可能是理解当前 AI 代理信任困境最好的概括。各种”AI 信任框架”和”可解释 AI”方法论,都试图解决这个黑箱问题——但真正能建立信任的,可能不是更漂亮的可视化仪表盘,而是让代理在某些任务上跑够十万公里


参考资料

  • 原文:I Trust My Car More Than My AI Agent. Here Is Why. — 作者 Pawel Jozefiak(2026-06-17)
  • 作者的其他相关文章:Bounded Agent、Self-improving Agent、Skills That Hold Their Value
  • 世界经济论坛就业预测(引用)
  • Apple WWDC 2026 Siri 改造公告

文档信息