Anthropic 工程师画像深度洞察：为什么 AI 公司最缺的不是博士，而是基础设施老兵？

一、一个违背直觉的工程团队

最近，科技行业招聘专家 seb@hiiinternet 对 Anthropic 1680 名工程师的公开 LinkedIn 履历进行了一次硬核背景普查。抓取 5306 份标注 Anthropic 为当前雇主的资料，筛选出 1680 名工程岗位，分析其过往 7986 条岗位描述，得出一系列与大众认知严重不符的数据：

闪电式扩张：过去 18 个月搭建起来的工程组织，现任员工任职时间中位数仅 10 个月，53% 的人加入不到一年
极度排斥新人：几乎只招「资深工程师」——工程经验中位数 12.2 年，小于 3 年经验的仅 50 人，应届生招聘基本为零
基础设施底色：40% 员工背景出现「基础设施」经历，分布式系统、数据库、安全各占 ~20%，强化学习背景仅 3.3%
博士神话破灭：工程团队中仅 13.7% 持有博士学位——每七人中才有一个 PhD
最大人才源不是 AI 实验室：遥遥领先的第一来源是 Google，其次才是 OpenAI、DeepMind 等友商
去科层化设计：80% 共享「技术组成员（Member of Technical Staff, MoTS）」头衔

这些冰冷数字的背后，隐藏着 AI 行业正在发生的深层范式转移——它不是 HR 部门的一时兴起的招聘偏好，而是 AI 产业化进程的必然映射。

二、根本原因：从「算法竞赛」到「系统战争」

2.1 技术收敛后的竞争焦点转移

当 Transformer 架构成为共识、RLHF 技术路线趋于成熟，AI 公司的核心竞争力已经悄然位移：

训练稳定性：万卡集群连续运行数周不出一次故障——这是分布式系统的可靠性问题
推理效率：将每个 token 的生产成本降至可商业化水平——这是系统工程优化问题
数据管道：PB 级数据的清洗、标注、管理——这是数据基础设施问题
部署可靠性：面向数亿用户的服务稳定性——这是 SRE 与运维问题

这些问题，本质上是系统问题，不是数学问题。它们不需要更多的算法洞见，而是需要大量见过真实生产环境大规模故障、亲手搭建过分布式系统的资深工程师。

2.2 Scaling Law 的系统代价

Scaling Law 的持续有效隐含着一个被忽视的前提：你的基础设施能支撑得起更大规模的训练。Anthropic 正在部署十万卡级别的训练集群，这带来的挑战是：

跨数据中心分布式训练的网络拓扑优化
GPU 利用率从 60% 提升到 90%+ 的调度策略
每天数百万次训练任务的编排与容错
万亿参数模型的高效推理

这些都不是论文能解决的问题。这需要的是在 Google 等超大规模云厂商摸爬滚打十年，处理过真实生产环境事故的系统工程师。

2.3 商业化的强制加速器

从研究实验室到产品公司，组织能力的转型必然伴随人才结构的重塑。Anthropic 在 18 个月内将工程团队从 200+ 扩张到 ~1700 人，这种速度决定了它无法慢慢培养新人——它需要的是「拿来即用」的老兵。

这和互联网早期的模式如出一辙：Amazon 在 2000 年代初从电商转型为云服务商时，大量招募的是系统工程师而非研究人员。每一次「从实验室到工厂」的跨越，都伴随着人才结构的剧烈重构。

三、时代动力：AI 进入「工程驱动」阶段

用技术成熟度模型可以清楚地看清这个变化：

阶段	核心特征	主导人才	判断标准	代表时期
理论突破	论文+实验驱动	科学家	谁能做出更好的模型	2017-2021
工程固化	系统+产品化	混合团队	谁能稳定跑起大模型	2022-2025
规模化	成本+效率竞争	系统工程师	谁能以最低成本部署最好的模型	2025+

Anthropic 的招聘数据是一个清晰的信号：我们正处在从第二阶段向第三阶段跨越的拐点。AI 公司的竞争，已经从「谁的模型更好」变成了「谁能以最低成本、最高效率地训练和部署同等水平的模型」。

这不是一个边际变化，而是 AI 行业价值链的根本重构。模型的「创造性」溢价在下降，「可靠性」溢价在上升。这恰恰解释了为什么招聘池里最贵的不是顶级 AI 研究员，而是经历过万次代码评审、百次线上故障的资深工程师。

四、对工程师的启示：技能组合的重新定义

两个黄金赛道

路径 A：深水区构建者（匹配 12 年经验标准）

这是绝大多数工程师应该走的路。核心技能组合：

分布式系统：共识算法、分布式事务、CAP 权衡
大规模存储：对象存储、KV 存储、分布式文件系统
高性能计算：GPU 编排、网络拓扑、异构计算
底层基础设施：Linux 内核调优、网络协议栈、存储 I/O

典型养成路径：Google/Amazon/Meta 等云厂商 → AI 公司。Stripe、Databricks、Snowflake、Palantir 等工程硬核公司也是理想的中间站。

优势：不可替代性强，越老越值钱。12 年经验中位数不是歧视，而是对这个领域「经验积累有价值」的高度认可。这不是年轻人的游戏。

路径 B：天才少年通道（匹配竞赛/论文标准）

这是极小众的通道，数据上仅占 3-10%。172 名经验不足 6 年的「年轻例外」，其进入门槛高度异乎寻常：

顶级实习（50%）：Meta、Google、DeepMind 或顶级量化机构的实习经历
量化交易转场（9%）：来自 Jane Street、Two Sigma、Citadel 等，通常是 IOI 银牌以上、Codeforces 2900+ 的顶级选手
对齐方向 fellowship（6%）：深度参与 MATS、SERI、Redwood 等 AI 对齐研究计划

这条路的天赋门槛极高，供应量极小，不具备普遍参考价值。

工程师的战略选择

不要被「AI 公司需要 PhD」的叙事迷惑——数据证明绝大部分工程岗位不需要博士，需要的是系统能力。PhD 只占 13.7%
基础设施技能是真正的护城河——Python 框架可以几周学会，但分布式系统的直觉需要十年锻造。AI 公司的简历应该像「基础设施公司」而非「研究实验室」——展示你构建并扩展过的系统，而不是你读过的论文
跨学科价值被低估——Anthropic 的哲学系员工挤进前 20 专业，13 名哲学背景的工程人员在技术公司极不寻常，这与 AI 安全、对齐方向需要多元思维有关
不要被职级体系困扰——Anthropic 的天才设计：80% 持同一头衔「MoTS」，无论前身是 Instagram CTO 还是 Stanford 大牛。这消除了办公室政治和晋升焦虑，让你专注在事上
长期主义是回报率最高的策略——12 年经验中位数意味着这个领域认可「积累」，不是所谓的「35 岁危机」。当你拥有十年以上分布式系统的实战经验，你在 AI 公司的人才市场上就是稀缺品

五、对投资人的启示：AI 的「铲子」在哪里？

当所有人都去淘金时，卖铲子的人才是稳赚的。

Anthropic 的数据揭示了一个投资机会的层次结构：

第一层：物理基础设施（确定性最高）

AI 对算力的渴求正在催生数据中心建设狂潮。每个 Anthropic 这样的公司都需要：

数据中心设计与运营：万卡以上集群的供电、散热、空间
电力基础设施：核电、光伏+储能——AI 集群是电老虎
液冷散热：高密度 GPU 机柜需要新型散热方案
网络设备：400G/800G 交换机、高速光电互联

这些是 AI 军备竞赛的「硬通货」，无论哪个模型胜出，这些基础设施都会持续被消耗。

第二层：基础设施软件（高增长、高毛利）

构建和运维超大规模 AI 集群的工具链：

GPU 编排与调度：新一代 Kernel for AI——管理十万 GPU 的训练任务
分布式训练框架：大规模并行训练的效率优化
AI 专用存储：满足训练数据高吞吐、低延迟的存储系统
推理部署工具：模型量化、推理引擎、服务化

这一层的特征是软件边际成本低、客户粘性高。如果能被 Anthropic、OpenAI、Google 同时使用，就是战略性投资标的。

第三层：人才养成所（长线逻辑）

Anthropic 的前五大人才来源公司——Google、Stripe、Databricks、Snowflake、Palantir——它们本身就是值得关注的投资标的。这些公司或许不是直接的 AI 公司，但它们是 「AI 公司的工程师养成所」：

这些公司培养了大量具有超大规模系统构建经验的工程师
AI 公司抢人竞争越激烈，这些公司的工程师「出厂价」越高
未来十年，这个人才池只会越来越贵

关键投资洞察

AI 公司的研发成本结构正在从「养博士」转向「搭系统」——基础设施工程师的薪资溢价将逐步超过算法研究岗
纯粹算法初创公司的估值将承压——当模型能力趋于同质化，没有系统积累的 AI 公司缺乏护城河
基础设施服务商的利润率会提升——AI 军备竞赛中，所有玩家都需要它们的产品，而供给有限

六、反方视角与回应

反方 1：这不只是 Anthropic 一家公司的情况，不能以偏概全。OpenAI 可能更重视研究人才。

确实，每家公司的人才策略不同。但 Anthropic 作为仅次于 OpenAI 的头部 AI 实验室，其策略具有信号意义。如果连最重视「安全研究」的 Anthropic 都在大规模招募基础设施工程师，说明这个趋势具有普遍性。Google 正在做的 Gemini 训练同样需要大量系统工程师。

反方 2：当模型架构出现新的重大突破时，算法天才的价值会重新凸显。

对。但历史上每一次技术突破后的产业化路径都遵循类似的规律：突破依赖天才——工程化依赖系统——规模化依赖成本。对于投资人来说，短期的「突破不确定性」风险太大，而「工程化确定性」的可预测性高得多。

反方 3：基础设施老兵可以高薪招聘，但 AI 公司的核心竞争力终究是模型能力。

这是一个常见的误区。当所有公司都能用同样的模型架构（Transformer）、同样的硬件（H100/B200）、同样的算法（RLHF/DPO），核心竞争力恰恰体现在系统能力上——谁能更快迭代、更低成本、更稳定运行。基础设施老兵直接决定这些指标。

七、结语

这个数据集的启示远不止于招聘策略。它是 AI 产业化的一个清醒信号：当技术突破完成、工程定型之后，剩下的都是苦活累活——大规模系统的稳定性、成本、效率。而这些苦活累活，恰恰是决定最终胜负的关键。

对于工程师来说，系统的深度比算法的广度更有价值。对于投资人来说，赌「算法天才」不如赌「工程老兵」。

AI 的下一幕，不是天才的独角戏，而是老兵的集体战。

参考资料

原文：机器之心报道《从 1680 份 LinkedIn 数据看 Anthropic 到底需要什么样的人》 mp.weixin.qq.com/s/ygwv56xi7BGMcJD1wCqxOw
原文引用的原始分析：seb@hiiinternet 对 Anthropic LinkedIn 履历抓取分析

文档信息

本文作者：zhupite
本文链接：https://zhupite.com/thinking/anthropic-engineer-portrait-insight.html
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）