在人工智能领域,GPU曾长期占据核心地位,成为衡量AI基础设施能力的重要指标。无论是英伟达的市值攀升、云服务提供商的资本投入,还是模型开发者的训练进度,最终都归结为谁能获取更多GPU资源。然而,随着技术演进,这一格局正在发生深刻变化。
英伟达创始人黄仁勋在近期行业峰会上提出的新战略,标志着公司业务重心开始向CPU领域延伸。他推出的RTX Spark处理器将个人电脑重新定义为"需求驱动型设备",用户无需手动操作应用即可完成复杂任务。同时,英伟达首款数据中心专用CPU Vera的亮相,更被视为公司未来增长的新引擎。这款搭载88个自研核心的处理器,专门针对AI智能体的任务编排、工具调用和长上下文管理进行优化,标志着英伟达正式加入CPU市场竞争。
技术变革的背后是AI应用形态的根本性转变。早期生成式AI主要聚焦模型训练,这种需要处理海量并行计算的任务恰好是GPU的强项。但随着AI从模型训练向大规模推理演进,特别是进入智能体时代,工作负载特性发生了显著变化。现代智能体系统不再满足于简单的问答交互,而是需要将复杂任务分解为多个步骤,涉及数据库读写、网络搜索、代码执行、权限验证等多样化操作。这些任务虽然仍需GPU进行模型推理,但推理前后的流程控制、资源调度和数据流动都高度依赖CPU。
行业研究数据印证了这种转变。佐治亚理工学院与英特尔的联合研究发现,在智能体工作负载中,CPU承担的工具处理环节占总延迟的50%-90%。这意味着用户等待时间往往不是由GPU计算能力决定,而是取决于CPU能否及时完成数据准备和任务调度。汇丰证券的报告则从另一个角度指出,现代智能体工作流中约44%的计算任务高度依赖CPU,这个比例是传统文本生成模型的三到四倍。这种变化直接导致服务器配置比例调整,从过去的"1-2颗CPU搭配8颗GPU"逐渐向"1:4"甚至"1:1"的比例演变。
芯片厂商的战略调整反映了市场需求的转变。AMD董事长苏姿丰多次强调,业界此前低估了CPU在AI时代的重要性。她预测未来三到四年数据中心市场规模将突破万亿美元,这个市场需要CPU、GPU、ASIC等多种技术共同支撑。AMD最新推出的第六代EPYC处理器采用台积电2纳米制程,成为行业首个进入量产阶段的高性能计算芯片。其衍生型号Verano通过集成LPDDR内存技术,专门应对智能体对大容量内存的需求。财报显示,2025年第四季度AMD数据中心业务营收达54亿美元,同比增长39%。
英伟达的CPU战略则着眼于系统级优化。公司推出的Vera CPU不仅兼容Armv9.2指令集,还在CPU层面原生支持FP8精度运算。其独特的空间多线程技术通过物理分区核心资源,提供176个硬件线程,有效解决了传统超线程技术导致的性能波动问题。这种设计使每个线程在处理复杂逻辑分支时都能获得稳定的延迟表现,特别适合需要精确控制的任务编排场景。首批Vera系统已交付给Anthropic、OpenAI等领先AI企业使用。
这场变革正在引发产业链的连锁反应。随着AI推理需求激增,CPU市场出现结构性短缺。英特尔向中国客户发出预警,部分服务器CPU交付周期延长至六个月,产品价格涨幅超过10%。AMD部分产品的交期也延长至8-10周。这种供应紧张不仅影响服务器市场,还通过产能挤压传导至消费端。由于数据中心GPU订单利润率更高,芯片代工厂优先保障这类订单的生产,导致通用CPU产能受限。服务器市场的旺盛需求又引发内存短缺,进一步加剧了提前囤货现象,最终推高了整个市场的价格水平。
从能源供应到精密制造,AI发展的每个阶段都受到基础设施条件的制约。当前这场围绕CPU的竞争,本质上是AI技术向更深层次发展时对基础支撑能力的重新审视。当智能体系统需要处理越来越复杂的现实任务时,单纯依靠GPU的算力优势已经不够,整个计算系统的平衡设计变得至关重要。这种转变提醒我们,真正的AI突破不仅需要算法创新,更需要构建与之匹配的硬件生态系统。




