一、一个违背直觉的工程团队
最近,科技行业招聘专家 seb@hiiinternet 对 Anthropic 1680 名工程师的公开 LinkedIn 履历进行了一次硬核背景普查。抓取 5306 份标注 Anthropic 为当前雇主的资料,筛选出 1680 名工程岗位,分析其过往 7986 条岗位描述,得出一系列与大众认知严重不符的数据:
- 闪电式扩张:过去 18 个月搭建起来的工程组织,现任员工任职时间中位数仅 10 个月,53% 的人加入不到一年
- 极度排斥新人:几乎只招「资深工程师」——工程经验中位数 12.2 年,小于 3 年经验的仅 50 人,应届生招聘基本为零
- 基础设施底色:40% 员工背景出现「基础设施」经历,分布式系统、数据库、安全各占 ~20%,强化学习背景仅 3.3%
- 博士神话破灭:工程团队中仅 13.7% 持有博士学位——每七人中才有一个 PhD
- 最大人才源不是 AI 实验室:遥遥领先的第一来源是 Google,其次才是 OpenAI、DeepMind 等友商
- 去科层化设计:80% 共享「技术组成员(Member of Technical Staff, MoTS)」头衔
这些冰冷数字的背后,隐藏着 AI 行业正在发生的深层范式转移——它不是 HR 部门的一时兴起的招聘偏好,而是 AI 产业化进程的必然映射。
二、根本原因:从「算法竞赛」到「系统战争」
2.1 技术收敛后的竞争焦点转移
当 Transformer 架构成为共识、RLHF 技术路线趋于成熟,AI 公司的核心竞争力已经悄然位移:
- 训练稳定性:万卡集群连续运行数周不出一次故障——这是分布式系统的可靠性问题
- 推理效率:将每个 token 的生产成本降至可商业化水平——这是系统工程优化问题
- 数据管道:PB 级数据的清洗、标注、管理——这是数据基础设施问题
- 部署可靠性:面向数亿用户的服务稳定性——这是 SRE 与运维问题
这些问题,本质上是系统问题,不是数学问题。它们不需要更多的算法洞见,而是需要大量见过真实生产环境大规模故障、亲手搭建过分布式系统的资深工程师。
2.2 Scaling Law 的系统代价
Scaling Law 的持续有效隐含着一个被忽视的前提:你的基础设施能支撑得起更大规模的训练。Anthropic 正在部署十万卡级别的训练集群,这带来的挑战是:
- 跨数据中心分布式训练的网络拓扑优化
- GPU 利用率从 60% 提升到 90%+ 的调度策略
- 每天数百万次训练任务的编排与容错
- 万亿参数模型的高效推理
这些都不是论文能解决的问题。这需要的是在 Google 等超大规模云厂商摸爬滚打十年,处理过真实生产环境事故的系统工程师。
2.3 商业化的强制加速器
从研究实验室到产品公司,组织能力的转型必然伴随人才结构的重塑。Anthropic 在 18 个月内将工程团队从 200+ 扩张到 ~1700 人,这种速度决定了它无法慢慢培养新人——它需要的是「拿来即用」的老兵。
这和互联网早期的模式如出一辙:Amazon 在 2000 年代初从电商转型为云服务商时,大量招募的是系统工程师而非研究人员。每一次「从实验室到工厂」的跨越,都伴随着人才结构的剧烈重构。
三、时代动力:AI 进入「工程驱动」阶段
用技术成熟度模型可以清楚地看清这个变化:
| 阶段 | 核心特征 | 主导人才 | 判断标准 | 代表时期 |
|---|---|---|---|---|
| 理论突破 | 论文+实验驱动 | 科学家 | 谁能做出更好的模型 | 2017-2021 |
| 工程固化 | 系统+产品化 | 混合团队 | 谁能稳定跑起大模型 | 2022-2025 |
| 规模化 | 成本+效率竞争 | 系统工程师 | 谁能以最低成本部署最好的模型 | 2025+ |
Anthropic 的招聘数据是一个清晰的信号:我们正处在从第二阶段向第三阶段跨越的拐点。AI 公司的竞争,已经从「谁的模型更好」变成了「谁能以最低成本、最高效率地训练和部署同等水平的模型」。
这不是一个边际变化,而是 AI 行业价值链的根本重构。模型的「创造性」溢价在下降,「可靠性」溢价在上升。这恰恰解释了为什么招聘池里最贵的不是顶级 AI 研究员,而是经历过万次代码评审、百次线上故障的资深工程师。
四、对工程师的启示:技能组合的重新定义
两个黄金赛道
路径 A:深水区构建者(匹配 12 年经验标准)
这是绝大多数工程师应该走的路。核心技能组合:
- 分布式系统:共识算法、分布式事务、CAP 权衡
- 大规模存储:对象存储、KV 存储、分布式文件系统
- 高性能计算:GPU 编排、网络拓扑、异构计算
- 底层基础设施:Linux 内核调优、网络协议栈、存储 I/O
典型养成路径:Google/Amazon/Meta 等云厂商 → AI 公司。Stripe、Databricks、Snowflake、Palantir 等工程硬核公司也是理想的中间站。
优势:不可替代性强,越老越值钱。12 年经验中位数不是歧视,而是对这个领域「经验积累有价值」的高度认可。这不是年轻人的游戏。
路径 B:天才少年通道(匹配竞赛/论文标准)
这是极小众的通道,数据上仅占 3-10%。172 名经验不足 6 年的「年轻例外」,其进入门槛高度异乎寻常:
- 顶级实习(50%):Meta、Google、DeepMind 或顶级量化机构的实习经历
- 量化交易转场(9%):来自 Jane Street、Two Sigma、Citadel 等,通常是 IOI 银牌以上、Codeforces 2900+ 的顶级选手
- 对齐方向 fellowship(6%):深度参与 MATS、SERI、Redwood 等 AI 对齐研究计划
这条路的天赋门槛极高,供应量极小,不具备普遍参考价值。
工程师的战略选择
不要被「AI 公司需要 PhD」的叙事迷惑——数据证明绝大部分工程岗位不需要博士,需要的是系统能力。PhD 只占 13.7%
基础设施技能是真正的护城河——Python 框架可以几周学会,但分布式系统的直觉需要十年锻造。AI 公司的简历应该像「基础设施公司」而非「研究实验室」——展示你构建并扩展过的系统,而不是你读过的论文
跨学科价值被低估——Anthropic 的哲学系员工挤进前 20 专业,13 名哲学背景的工程人员在技术公司极不寻常,这与 AI 安全、对齐方向需要多元思维有关
不要被职级体系困扰——Anthropic 的天才设计:80% 持同一头衔「MoTS」,无论前身是 Instagram CTO 还是 Stanford 大牛。这消除了办公室政治和晋升焦虑,让你专注在事上
长期主义是回报率最高的策略——12 年经验中位数意味着这个领域认可「积累」,不是所谓的「35 岁危机」。当你拥有十年以上分布式系统的实战经验,你在 AI 公司的人才市场上就是稀缺品
五、对投资人的启示:AI 的「铲子」在哪里?
当所有人都去淘金时,卖铲子的人才是稳赚的。
Anthropic 的数据揭示了一个投资机会的层次结构:
第一层:物理基础设施(确定性最高)
AI 对算力的渴求正在催生数据中心建设狂潮。每个 Anthropic 这样的公司都需要:
- 数据中心设计与运营:万卡以上集群的供电、散热、空间
- 电力基础设施:核电、光伏+储能——AI 集群是电老虎
- 液冷散热:高密度 GPU 机柜需要新型散热方案
- 网络设备:400G/800G 交换机、高速光电互联
这些是 AI 军备竞赛的「硬通货」,无论哪个模型胜出,这些基础设施都会持续被消耗。
第二层:基础设施软件(高增长、高毛利)
构建和运维超大规模 AI 集群的工具链:
- GPU 编排与调度:新一代 Kernel for AI——管理十万 GPU 的训练任务
- 分布式训练框架:大规模并行训练的效率优化
- AI 专用存储:满足训练数据高吞吐、低延迟的存储系统
- 推理部署工具:模型量化、推理引擎、服务化
这一层的特征是软件边际成本低、客户粘性高。如果能被 Anthropic、OpenAI、Google 同时使用,就是战略性投资标的。
第三层:人才养成所(长线逻辑)
Anthropic 的前五大人才来源公司——Google、Stripe、Databricks、Snowflake、Palantir——它们本身就是值得关注的投资标的。这些公司或许不是直接的 AI 公司,但它们是 「AI 公司的工程师养成所」:
- 这些公司培养了大量具有超大规模系统构建经验的工程师
- AI 公司抢人竞争越激烈,这些公司的工程师「出厂价」越高
- 未来十年,这个人才池只会越来越贵
关键投资洞察
- AI 公司的研发成本结构正在从「养博士」转向「搭系统」——基础设施工程师的薪资溢价将逐步超过算法研究岗
- 纯粹算法初创公司的估值将承压——当模型能力趋于同质化,没有系统积累的 AI 公司缺乏护城河
- 基础设施服务商的利润率会提升——AI 军备竞赛中,所有玩家都需要它们的产品,而供给有限
六、反方视角与回应
反方 1:这不只是 Anthropic 一家公司的情况,不能以偏概全。OpenAI 可能更重视研究人才。
确实,每家公司的人才策略不同。但 Anthropic 作为仅次于 OpenAI 的头部 AI 实验室,其策略具有信号意义。如果连最重视「安全研究」的 Anthropic 都在大规模招募基础设施工程师,说明这个趋势具有普遍性。Google 正在做的 Gemini 训练同样需要大量系统工程师。
反方 2:当模型架构出现新的重大突破时,算法天才的价值会重新凸显。
对。但历史上每一次技术突破后的产业化路径都遵循类似的规律:突破依赖天才——工程化依赖系统——规模化依赖成本。对于投资人来说,短期的「突破不确定性」风险太大,而「工程化确定性」的可预测性高得多。
反方 3:基础设施老兵可以高薪招聘,但 AI 公司的核心竞争力终究是模型能力。
这是一个常见的误区。当所有公司都能用同样的模型架构(Transformer)、同样的硬件(H100/B200)、同样的算法(RLHF/DPO),核心竞争力恰恰体现在系统能力上——谁能更快迭代、更低成本、更稳定运行。基础设施老兵直接决定这些指标。
七、结语
这个数据集的启示远不止于招聘策略。它是 AI 产业化的一个清醒信号:当技术突破完成、工程定型之后,剩下的都是苦活累活——大规模系统的稳定性、成本、效率。而这些苦活累活,恰恰是决定最终胜负的关键。
对于工程师来说,系统的深度比算法的广度更有价值。 对于投资人来说,赌「算法天才」不如赌「工程老兵」。
AI 的下一幕,不是天才的独角戏,而是老兵的集体战。
参考资料
- 原文:机器之心报道《从 1680 份 LinkedIn 数据看 Anthropic 到底需要什么样的人》 mp.weixin.qq.com/s/ygwv56xi7BGMcJD1wCqxOw
- 原文引用的原始分析:seb@hiiinternet 对 Anthropic LinkedIn 履历抓取分析
文档信息
- 本文作者:zhupite
- 本文链接:https://zhupite.com/thinking/anthropic-engineer-portrait-insight.html
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)