全速加载中...

当"瑞士军刀"遇见"手术刀"：OpenAI自研芯片Jalapeño与AI算力的范式转移

2026年6月24日，OpenAI与博通联合发布了一款名为Jalapeño的定制AI芯片——这是OpenAI历史上第一款自研处理器，专为大语言模型推理任务设计。从设计到流片仅用了9个月，创下了高性能ASIC芯片开发速度的行业纪录。

但这不仅仅是一款芯片的发布。它标志着一个时代的分水岭：AI算力竞争正在从"买谁的GPU"转向"造自己的芯片"，英伟达的GPU帝国第一次面临来自终端模型厂商的真正结构性挑战。

发生了什么

Jalapeño芯片由OpenAI主导架构设计，博通负责硅片制造和网络技术（包括其Tomahawk网络芯片），天弘科技负责主板、机架和系统集成，台积电采用3nm工艺代工。芯片配备八个HBM存储堆栈，目标是将推理成本降低约50%。

关键点在于：这款芯片不对外销售，仅供OpenAI内部使用。它不是要卖给其他公司竞争的通用产品，而是OpenAI为自身ChatGPT、Codex、API接口及未来智能体产品构建的专属算力底座。

官方计划在2026年底开始部署，未来四年目标部署10吉瓦算力。博通CEO Hock Tan透露，Jalapeño的能效比显著优于当前最先进水平。

技术原理：为什么推理需要专用芯片

要理解Jalapeño的意义，首先要理解AI计算中训练与推理的根本差异。

训练阶段需要海量并行计算和高精度浮点运算，数据吞吐量巨大，对通用性的要求更高——这正是GPU擅长的领域。英伟达的H100、B200之所以统治训练市场，正是因为GPU的多核架构能够同时处理成千上万的并行线程。

推理阶段则完全不同。当ChatGPT为你生成一条回复时，核心诉求是低延迟、高能效和内存带宽。模型参数已经训练完成，只需要沿着计算图做一次前向传播。这种场景下，芯片不需要面面俱到，而是需要针对特定工作负载做极致优化。

这就是ASIC（专用集成电路）的用武之地。

如果把GPU比作"瑞士军刀"——什么都能干，但每项都不是最优——那么ASIC就是一把"手术刀"。它针对特定算法做了硬件级优化，去掉了所有不必要的通用计算单元，只保留推理所需的核心逻辑。

Jalapeño的设计哲学正是如此。OpenAI官方明确表示："Jalapeño是一个从零开始的空白画布设计，不是从早期AI工作负载改编而来的通用加速器。"它从架构层面就为LLM推理场景量身定制。

具体来说，这类推理ASIC的核心优化方向包括：

内存带宽优先：LLM推理是典型的"内存墙"问题，模型参数动辄数百GB，计算单元经常处于等待数据的状态。Jalapeño配备8个HBM堆栈，极大缓解了数据传输瓶颈。
精度灵活适配：推理不需要训练时的FP16/BF16高精度，INT8甚至INT4量化就能保持可接受的准确度。ASIC可以针对低精度计算做电路级优化，大幅提升吞吐。
固定计算图优化：训练的计算图可能因梯度检查点等技术而变化，但推理的计算图是固定的。ASIC可以针对固定图做静态编译和流水线优化，减少开销。
网络互联定制：博通贡献的Tomahawk网络芯片确保了大规模集群内部的低延迟通信，这对于分布式推理至关重要。

行业影响：英伟达的"罗马帝国"正在松动

OpenAI发布Jalapeño不是孤立事件，而是整个AI芯片行业结构性转变的一个缩影。

ASIC时代正在加速到来。 根据Deloitte的预测，到2026年推理工作负载将占所有AI算力的三分之二，较2023年的三分之一大幅增长。TrendForce预测，基于ASIC的AI服务器出货量在2026年将超过总出货量的30%。

更关键的数据是：定制ASIC芯片的年增长率达到44.6%，而GPU的增长率仅为16.1%。这个增速差距意味着什么？意味着ASIC正在以两倍以上的速度蚕食GPU的市场份额。

放眼整个行业，"百芯大战"已经全面开打：

厂商	自研芯片	状态
Google	TPU v7 Ironwood	已大规模部署，推理成本较H100低70%
Microsoft	Maia 200	已部署，Azure云平台可用
Amazon	Trainium 3	持续迭代中
Meta	MTIA v2	内部大规模使用
OpenAI	Jalapeño	2026年底部署
Apple	各类Neural Engine	端侧推理主导

值得注意的是，博通在这个生态中扮演了关键角色。它不仅是OpenAI Jalapeño的联合设计方，同时也是Google TPU、Meta MTIA的主要后端设计合作伙伴。据估算，博通在ASIC设计服务市场占据55%-60%的份额，已经成为"芯片背后的芯片公司"。

这对英伟达意味着什么？

短期来看，英伟达依然强大。CUDA软件生态壁垒、Blackwell架构的绝对算力优势、以及"买得越多省得越多"的网络效应，让英伟达在可预见的未来仍是行业风向标。英伟达FY2025年整体毛利率高达75.5%，净利率57%，单颗GPU成本不足3万美元却能卖出10万美元，这种盈利能力令人战栗。

但中长期来看，ASIC的定制化优势在成本控制上的潜力不容忽视。当头部大模型厂商的AI资本开支逼近千亿美元量级时，每一分推理成本的降低都意味着数亿美元的利润空间。OpenAI选择自研芯片，本质上是把竞争从"模型层"压到了"芯片层"和"数据中心层"——这是更深层、也更难复制的护城河。

适用场景：谁该用什么？

并非所有场景都适合ASIC。理解GPU与ASIC的适用边界，对技术决策至关重要。

GPU更适合的场景：

模型训练（尤其是前沿研究阶段，算法频繁迭代）
多租户云平台（需要运行不同模型、不同框架）
初创公司和中小规模部署（无需承担ASIC的高昂NRE成本）
需要快速验证新算法的研究场景

ASIC更适合的场景：

超大规模推理部署（百万级QPS级别）
固定模型架构的长期运行（如ChatGPT主力推理）
对成本和能效极度敏感的业务
头部大厂有足够体量摊薄ASIC的流片成本（通常数亿美元起步）

这就是为什么我们看到一个有趣的现象：英伟达并没有被ASIC"取代"，而是市场在分层。训练市场继续由GPU主导，推理市场则加速向ASIC迁移。两者不是零和博弈，而是各司其职。

我的观点：OpenAI的这一步，下得很大但也很有必要

Jalapeño的发布让我想到一个更深层的趋势：AI行业的垂直整合正在从"软件层"向下延伸到"硬件层"。

过去十年，AI行业的分工非常清晰——芯片公司造硬件，云厂商提供基础设施，模型公司训练模型，应用公司做产品。这种分工效率高、专业化程度强。但当算力成本成为制约AI发展的核心瓶颈时，这种分工模式就开始暴露出局限性。

OpenAI选择自研芯片，本质上是在说："我们不能再把算力命脉交给英伟达了。"

这个决定的风险也不容忽视。芯片设计是一门极其复杂的工程，需要深厚的硬件专业知识、巨额的前期投入和漫长的开发周期。OpenAI作为一家软件出身的公司，跨界做芯片并非易事。好在它选择了博通这样的老牌半导体巨头作为合作伙伴，用"联合设计"的模式降低了技术风险。

但我认为，OpenAI这一步棋的下法是正确的，而且可能只是开始。

未来三年，我们很可能会看到更多模型厂商加入自研芯片的行列。不是因为每家公司都必须造芯片，而是因为当头部玩家开始自建算力底座时，整个行业的成本结构会发生不可逆的变化。英伟达的定价权会被削弱，GPU的溢价空间会被压缩，最终受益的是整个AI产业——更多的公司能以更低的成本运行更大的模型。

这也引出了一个更值得思考的问题：当AI算力从"稀缺资源"变为"可定制商品"时，AI行业的竞争焦点会从"谁有算力"转向"谁用得好算力"。芯片只是基础设施，真正的壁垒依然是算法创新、数据质量和产品体验。

Jalapeño不是终点，而是一个信号——AI算力的"罗马帝国时代"正在走向多极化，而这个多极化的世界，对创新者来说，或许比垄断时代更有机会。

参考链接

OpenAI and Broadcom unveil LLM-optimized inference chip

OpenAI unveils its first custom chip, built by Broadcom

OpenAI and Broadcom reveal Jalapeno, first AI chip in partnership

The custom AI ASIC state of play (May 2026)

OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor

OpenAI's New 'Jalapeño' AI Chip Will Power Next-Generation AI

OpenAI's First Custom AI Chip Targets 50% Cheaper Inference

什么是ASIC芯片：全面了解专用集成电路

GPU vs ASIC的推理成本对比

评论一下

评论列表

等待第一条评论中…