造血者胜：Anthropic何以超越OpenAI -区块周刊BlockWeeks

纳斯达克互联网泡沫巅峰时刻的2000年1月，被视为最大网络服务商的美国在线以1640亿美元的市值，反向收购了时代华纳。

美国在线没有多少利润，但有不断膨胀的用户数和一轮接一轮涌入的资本。时代华纳有现金流、有内容、有基础设施，但在市场眼里，它是一家旧时代公司。

收购完成的2年后，合并实体却录得史上最大的987亿美元亏损纪录。美国在线的用户增长神话碎裂，拨号上网被宽带取代，赖以为生的订阅收入和广告收入同时塌缩。

26年后，一场结构高度相似的命运分岔正在加速递归的AI行业上演。

2026年4月7日，Anthropic宣布年化收入突破300亿美元，超过OpenAI同期的250亿美元。

这是这家公司成立以来第一次在收入维度反超对手。15个月前，它的年化收入还只有10亿美元。

同一时间，OpenAI正在为一场可能在今年四季度进行的IPO做准备。它刚刚关闭了硅谷史上最大的1220亿美元私募融资，估值达到8520亿，但同时预计2026年亏损140亿美元，现金流转正的时间被推迟到了2030年。

一个造血能力在加速增强，一个在输血需求却在悄然上升。

两条截然迥异的AI发展路线，或许从创始人离开彼此那一天就已经注定。

输血or造血

OpenAI的扩张速度在商业史上很难找到参照物。

2024年底年化收入37亿美元，2025年底翻到200亿，2026年2月到达250亿。山姆·奥特曼对投资者的承诺是2030年收入达到2800亿美元。为了支撑这个叙事，OpenAI在过去一年签下了包括微软、亚马逊、甲骨文等在内的超过5000亿美元的云计算合约。

这些数字的另一面是OpenAI在2025年上半年的研发支出就达67亿美元，股权激励近25亿美元。2025全年现金消耗约85亿美元。2026年，仅推理成本一项预计就将达到141亿，比2025年增长68%。公司预计2026年全年亏损140亿美元，2027年现金消耗将飙升至570亿。

作为CFO的萨拉・弗莱尔（SarahFriar）在公司内部坦承了这一现实，她与奥特曼在IPO时机上产生了分歧，弗莱尔认为公司应当先建立更稳固的财务基础，而奥特曼将IPO视为筹集基础设施资金的工具。

OpenAI背后还藏有一项潜在的财务义务，即每一美元收入中，20%要以分成形式支付给微软，这一安排延续至2032年。2026和2027两年，OpenAI预计将向微软支付超过130亿美元的收入分成。

今年3月，寿终正寝的Sora可能就是奥特曼执念于延长战线的结果。

从预览效果最早震动业界，到后来与迪士尼达成合作，Sora一度成为AI视频领域最被看重的明星项目，但据《华尔街日报》调查，Sora的全球用户在突破100万后迅速回落至不到50万。每天运营成本约100万美元。每一个生成视频的用户都在消耗有限的GPU资源。

2025年12月2日，奥特曼向全公司发出CodeRed备忘录，要求将资源从广告、健康、购物等多条战线回撤，全力改善ChatGPT。并在备忘录中直言：

公司正处于ChatGPT的关键时刻。广告计划搁置，Agent开发延期，一个名为Pulse的个性化助手项目暂停。

3个多月后的2026年3月24日，OpenAI正式决定关闭Sora，而迪士尼都是在公告发出前不到一个小时才得知消息的。

与多面作战的Open AI不同，Anthropic表现出了另一种增长逻辑。

2024年12月还是10亿美元的年化收入，2025年中就已到达约47亿，年底到达90亿。2026年2月，达到了140亿；3-4月分别达到190亿和300亿，对Open AI实现了反超。

15个月的30倍速度，在企业软件历史上几乎没有先例。

增长的核心驱动并非来自C端的用户订阅，而是企业API调用，其中80%收入来自商业客户。截至2026年4月，超过1000家企业每年在Claude上的支出超过100万美元，而财富10强中有8家是Claude的客户。

作为核心产品的ClaudeCode，这个2025年5月才公开发布的编程工具目前年化收入已超过25亿美元，自2026年初以来翻了一倍以上。它在AI编程的份额达到54%，远超GitHubCopilot和Cursor。目前全球4%的公开GitHub提交由ClaudeCode完成，预计年底将达到20%以上。

这里存在着一个关键的效率差异：Anthropic每月活跃用户的变现能力约为211美元，OpenAI约为25美元。前者是后者的8倍。用户量小得多，单位变现效率高得多。

在企业大模型的API市场，Anthropic的份额从2023年的12%升至2025年中的32%，成为市场第一，而同期OpenAI从50%降至25%。

一项来自Ramp 经济实验室的调研显示，在美国企业的AI支出中，Anthropic占Anthropic+OpenAI合计支出的比例，已从2025年初的约10%攀升至2026年2月的60-65%。

更重要的是成本端。OpenAI到2030年的年训练成本预计达到1250亿美元，Anthropic约为300亿。同一场竞赛，4倍的成本差距。Anthropic预计2027年实现自由现金流为正，OpenAI则将盈亏平衡推到了2029年甚至2030年。

技术人底色

两条不同AI路径背后，存在一个与AI企业创始人背景密切相关的根本性差异：达里奥・阿莫迪（Dario Amodei）他和几乎所有其他AI公司的掌舵者都不一样。

奥特曼是硅谷创投机构YC前总裁，一个职业投资人和公司运营者。DeepMind的哈萨比斯是神经科学家出身，但背后是Alphabet的组织机器，扎克伯格在哈佛宿舍里写网站出身，AI只是Meta的一条业务线。

在看国内，字节梁汝波、阿里吴泳铭、百度李彦宏大多是互联网企业家，AI对他们而言更多是重要的商业增长引擎。

阿莫迪是物理学家和计算神经科学家出身，普林斯顿的博士论文研究的是大规模神经电生理，即用电极记录真实的神经回路如何集体运作。

博士毕业后，他在斯坦福医学院做博士后，把机器学习应用于生物医学数据，然后去了百度和GoogleBrain做研究，直到2016年加入OpenAI并成长为研究副总裁，直接领导了GPT-2和GPT-3的开发，同时也是RLHF的共同发明人和ScalingLaws（缩放定律）的核心实践者。

这份履历决定了它的纯度。阿莫迪在正式创办公司之前，做了近十五年的一线研究，这让他更像是一个被迫学习商业的科学家。

这种背景决定了两件事。

第一，他清楚地知道AI现在能做什么、不能做什么。

在一档播客中，他这样描述能力曲线：如果你把到目前为止的曲线做一个外推，去年我们在本科水平，前年在高中生水平，现在开始接近博士水平……这确实让你觉得2026或2027可以到达AGI。但他紧接着说：仍然存在100年也达到不了的可能，只是概率在迅速降低。一个真正懂技术的人，会同时持有乐观和不确定性。

第二，他知道AI现阶段最先能在哪里创造真实价值。

2025年5月，在Anthropic首次开发者大会CodewithClaude上，他被问及幻觉问题时说：这取决于你怎么衡量，但我怀疑AI模型产生幻觉的频率可能比人类低，只是幻觉的方式更令人意外。

这句话看似大胆，实则包含一个精确的限定，他承认AI的置信度表达方式是个问题，也没有回避模型的缺陷，但会把它放在一个可以被工程手段持续改进的框架里。

一个研究了十五年神经回路的人，对模型能力的边界有一种肌肉记忆式的感知。他不会因为Demo效果炸裂就急着推向市场，也不会因为投资人期待就去铺一条全模态的产品线。

这解释了Anthropic为什么没有去碰图像生成、视频生成、搜索引擎、社交App这些方向。

或许阿莫迪深知，在当前模型能力的真实边界内，这些方向要么无法产生稳定的商业价值，要么会消耗大量算力却无法转化为付费收入。

他选择把所有资源集中在文本、代码和Agent上。

这些场景的共同特征是：AI的输出可以被精确衡量，可以直接替换人工，客户愿意为可计量的生产力提升买单。

2026年1月，阿莫迪在长文《技术的青春期》(TheAdolescenceofTechnology)中强调：

AI带来的威胁来自多个方向，减轻某些危险可能会使其他危险恶化——如果我们不能极其谨慎地穿过这根针眼的话。

他用了一个词：

intimidating gauntlet——令人生畏的关卡

其列举的风险正是技术本身失控的风险。

对边界的自觉，和对AI当前能力的清醒判断，共同塑造了Anthropic循序渐进、逐步释放能力的工程化演进路径。

OpenAI

OpenAI如何失焦

作为YC前总裁，奥特曼的核心能力不在技术，而是融资和叙事能力。

OpenAI的每一步都服务于同一个目标：在每一个可能的生态位上建立存在感，用规模叙事维持估值，用估值换取更多融资，用融资换取更大规模。

ChatGPT覆盖消费者，API覆盖开发者，Enterprise覆盖企业，Sora覆盖创意，Codex覆盖编程，Operator覆盖Agent，还有健康、购物、广告，在CodeRed备忘录之前，OpenAI同时在推进的产品线至少有七八条。

OpenAI的失焦不是2025年才开始的。它的根源可以追溯到微软130亿美元投资落地之后。

毕竟拿了钱，很多事就不由自己决定了。

这或许也是梁文锋一开始拒绝DeepSeek快速商业化和不追求融资的深层逻辑。

即使股东不是短视之辈，也倾向于以DCF视角来审视投入回报。当GPT-4在2023年遥遥领先时，以闭源防御、以加速商业化进攻，成为OpenAI的默认策略。订阅、API、Agent、打入iPhone供应链，大干快上。

代价首先体现在算力分配上。

2024年5月，OpenAI对齐团队负责人JanLeike辞职并加入Anthropic。彼时他坦言，过去几年里，OpenAI安全文化和流程已经让位于“闪亮产品”。他还透露团队一直在为获取算力而挣扎，但那些本该用于关键研究的计算资源越来越难争取到。

几乎同时，联合创始人兼首席科学家伊利亚・苏茨克弗（IlyaSutskever）也宣布离职，他们更早前掀起的那场”政变，表面上是一场关于AI安全的路线之争，但更深层矛盾可能在于：OpenAI的最高优先级到底应该是模型能力的持续推进，还是商业产品的快速变现。

之后的人才流失如同多米诺骨牌。

作为前CTO的MiraMurati离职创业并从OpenAI招走大量核心人才。研究主管安德烈・卡帕西（AndrejKarpathy）离开。多位关键研究员转投Anthropic、Meta和其他竞争者。

从结果看，OpenAI模型版本迭代时的“惊艳度”也在快速的边际下降，甚至去年末发布GPT-5.2时，它对训练过程几乎只字未提，只说找到了优化训练各阶段的方法。

过早的商业化，在相当程度上分散了通往更强模型的精力。这既包括了算力调度的分配，也带来了人才凝聚力上的消耗。

许多顶尖研究者，并不是靠高薪就能留住的，这些人走掉，反而是因为公司方向与他们的探索预期分道扬镳了。

到了奥特曼意识到不对劲的2025年末时，OpenAI在LMArena上已不是第一，企业API市场份额从50%跌至25%，模型能力的相对退步和商业化的过度扩张，几乎是同一枚硬币的两面。

奥特曼曾在去年11月写道：大型基础设施项目需要时间来建设，这就是为什么我们需要现在开始。这是我们正在做的赌注，鉴于我们所处的有利位置，我们感觉不错。

奥特曼的野心可以理解：规模会成为壁垒。只要足够大，足够早，竞争者就没有空间。

关键问题在于，AI不是社交网络、短视频或者电商，不存在网络效应驱动的赢家通吃逻辑。

每一次推理请求都有真实的GPU成本。用户越多，亏损越大——除非能在每一个场景上都实现足够高的付费转化率。

OpenAI的9亿周活跃用户中，付费订阅只有5000万个。75%的收入依赖订阅。消费侧的单位经济模型远未跑通。企业侧，份额正在被Anthropic蚕食。

2025年底，ChatGPT的网站流量在10月触及60亿次后连续两个月下滑。Salesforce的CEOMarcBenioff在Gemini3发布后公开宣布弃用ChatGPT；一位前OpenAI研究员则对《财富》杂志表示：CodeRed本身就很说明问题。

深层竞争账本

有一个被AI叙事长期忽略的反直觉事实：

大模型可能会杀死SaaS，但大模型不是SaaS。

传统SaaS的边际成本趋近于零。多一个用户，多一点存储和带宽，成本可以忽略不计。软件的毛利率往往可以达到70%-80%甚至更多。

模型的推理是实打实的算力消耗。

OpenAI的毛利率约为33%。相当于每收入1美元，有67美分花在了GPU上。Anthropic的毛利率约为40%，推理成本比内部预期超出了23%。

在找到高频、刚需、高付费意愿的应用场景之前，用户增长本身就是一个财务黑洞。

规模有可能成为护城河，但同时也会让支出同步攀升。

OpenAI的2025年推理支出已达约84亿美元，预计2026年将增至141亿。它的收入在增长，但成本的增长更快。

Anthropic选择了一条更窄但更落地的路径。

它没有试图让AI成为一个无所不能的万能入口，而是把AI明确为一个高效工作工具。

ClaudeCode替换的是企业预算中的具体项目，产品团队也反复强调这一点：

企业客户每年花100万美元以上，是因为Claude替代了原来在付费的东西。

Agent路线的核心逻辑是：不卖通用智能，卖自动化劳动。

它让AI完成可计量、可定价、可重复的任务。每一次Agent执行一个工作流，都是一次有明确ROI的交易。

这就解释了为什么Anthropic能在远小于OpenAI的用户规模上，实现更高的收入。它的客户不是在为”聊天”付费，而是在为”生产力替代”付费，两件事的单价差是迥然相异的。

刷榜这件小事

这背后可能还隐藏着两大AI巨头对商业目标的定义分歧。

很长时间以来，AI行业存在一种对刷榜的痴迷，最典型的莫过于行业公认的LMArena平台，它接受用户盲测两个模型结果然后投票，排名结论会被各家AI公司的叙事中被反复引用。

2025年4月，斯坦福、MIT等机构的一项联合研究发现，Meta、OpenAI、Google、Amazon等公司被允许私下测试多个模型变体，然后只公布得分最高的版本。

Meta在Llama4发布前私下测试了27个变体。Google在2025年初测试了10个Gemini和Gemma的变体。通过选择性提交，单个模型的得分可以被虚增多达100分。

离开Open AI的卡帕西就曾坦言，LMArena吸引了“不成比例的巨大关注度”，各实验室都在对它过拟合。AI评测公司SurgeAI的措辞更激烈，分析了500条LMArena投票后得出结论：在这个系统里，“自信击败了准确，格式击败了事实”。

Meta的Llama4事件或许是最典型案例。2025年4月，Llama4Maverick以1417的ELO分登上排行榜第二。但社区很快发现，提交给LMArena的是一个专门为对话风格优化的实验版本，回答冗长且充满emoji——这种风格恰好能讨好随机投票者。公开发布的版本在评测中直接跌到了第32-35名。

刷上限许多时候能够成为能力边际的突围，但有些时候只是一种证明自己的行为，是一种赢学。

它既能够让市场中习惯了预期叙事的击鼓传花游戏玩下去，也符合某些大企业的官僚主义和向上汇报文化。

它的受众并非客户，有时只是为了解决投资人焦虑和大企业内部的KPI，在LMArena上排名更高，融资路演的PPT上就多一份素材。

事实上，在国内科技公司的AI竞赛中，一些公司也痴迷于用基准测试或刷榜来证明自己领先，但模型的实际效果与使用率如何，不同用户心中反而有一杆不同于比武结果的秤。

这终究是一条执着于获得融资性现金流乃至市值管理的路径。

与此不同的是，Anthropic的产品逻辑却并不执念于刷榜来自我证明，也不围绕对话讨好度进行工程改造，它集中资源在SWE-benchVerified（衡量模型解决真实GitHub代码问题的能力）、Terminal-Bench（终端环境下的编程任务）、OSWorld（真实计算机操作任务）这类任务评价上。

它们的共同点是，测的不是模型能不能说漂亮话，而是能不能把活干完，这是两件截然不同的事。

Anthropic在发布Opus4.6时，曾精确描述了自己的实现细节：

我们用Claude构建Claude，我们的工程师每天用Claude Code写代码，每个新模型首先在我们自己的工作上测试。

当Replit的CEO说Sonnet4.5把代码编辑的错误率从9%降到了0%，当Cognition的CEO说它让Devin的端到端评测分提高了12%，这些就不再是排行榜上的数字，而是客户续约的理由。

许多时候，口碑和完成度的意义远远胜于跑分，因为跑分更多服务于估值叙事，而口碑才能提高客户留存。

等待中的校验

刷上限换来的融资性现金流，把活干完才能换来经营性现金流。

这两种思路的差异，在15个月内制造了从落后到反超的结果。

单就估值而言，目前OpenAI仍然保持着AI领域的领先估值，其以8520亿美元估值对应250亿年化收入，市销率约34倍。Anthropic以3800亿美元估值对应300亿年化收入，市销率约13倍。

市场看的固然不是OpenAI的未来现金流，而是在为一个”最大AI用户规模“的叙事买单，但随着未来1-2年这些AI巨头的陆续IPO，这个叙事迟早要接受公开市场的验证。

2026年下半年，OpenAI和Anthropic可能前后脚完成IPO。Anthropic计划最早10月上市，目标融资600亿美元以上，OpenAI的时间表也在四季度或2027年初。

现在让我们再回到文章开头的美国在线的巅峰期故事。

2000年，美国在线能用资本叙事吃掉了时代华纳，但故事始终有一个致命弱点：

需要不断被续约。

一旦增长停滞，一旦新的融资轮无法覆盖旧的亏损，故事就会迅速崩塌。

时代华纳的现金流在合并后依然在产生，美国在线的用户数在两年内归零。

狂热的早期，融资性现金流可以买来时间和声量，可泡沫褪去之后，唯有经营性现金流能让一家公司活着走出去。

阿莫迪和奥特曼在2021年分道扬镳时，几乎没有人认为Anthropic能活下来。五年后，它的年化收入超过了OpenAI，训练成本是对方的四分之一。它没有9亿用户，没有1.4万亿美元的基础设施承诺，没有迪士尼的合作，甚至失去了五角大楼的合同。

它只有一项令其他对手望尘莫及的长板：

更高效的自我造血。

本文来自微信公众号 “全天候科技”（ID：iawtmt），作者：全天候科技

免责声明：本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。

造血者胜：Anthropic何以超越OpenAI