Gartner：Token成本下降不会推动前沿智能普及化

日期：2026-04-16 作者：itcg 浏览：1861 我要评论

导读：Gartner：Token成本下降不会推动前沿智能普及化

4月16日消息，Gartner预测，到2030年，生成式AI提供商对1万亿参数大语言模型（LLM）的推理成本将比2025年降低90%以上。

AI Token是生成式AI模型处理的数据单位。本次分析中，1 Token等于3.5字节数据，约合4字符。

Gartner高级研究总监Will Sommer表示：“推动这一成本下降的因素包括半导体和基础设施效率的提升、模型设计方面的创新、芯片利用率的提高、专用推理芯片的普及以及针对特定用例的边缘设备应用。”

基于这些趋势，Gartner预测，到2030年，大语言模型的成本效益将比2022年开发的同等规模早期模型高出多达100倍。

然而，生成式AI提供商的Token成本下降不会完全传导给企业客户。前沿智能所需的Token数量将远超当前主流应用。例如，代理式模型每项任务所需的Token数量是标准生成式AI聊天机器人的5至30倍并且能够执行比人类使用生成式AI更多的任务。

尽管Token单位成本的下降将推动生成式AI技术的进步，但这些进步将导致Token需求急剧增长。由于Token消耗增速快于成本降幅，预计整体推理成本仍将上升。

Sommer表示：“首席产品官（CPO）不应将商品Token成本的下降与前沿推理的普及混为一谈。随着商品化智能的成本趋近于零，支持高级推理所需的计算和系统资源依然稀缺。如果当前首席产品官用廉价的Token掩盖架构的低效，那么将来会在实现代理式应用规模化上遇到难题。”

为了创造价值，平台需要能够编排多种不同模型的工作负载。常规的高频任务必须发送到更高效的小型和领域专用语言模型，这些模型如果能够与专业工作流对齐，则其性能会优于通用解决方案且成本仅为后者的一小部分。必须严格管控前沿级模型的高成本推理并且仅将其用于高利润、复杂的推理任务。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

AWS多个数据中心瘫痪，因可能的无人机或导弹攻击而被关闭	苹果AI大动作：桌面机器人、智能音箱、家用摄像头齐上阵
北京现代EO（ELEXIO）试驾：家用纯电SUV驾驶体验舒适又稳健	OPPO无网通信再升级：图片传输成亮点，探索去中心化通信新潜力

相关资讯

• 五菱星光L上市：11万级6座中大型插混SUV，精准	• 华为Pura 100系列蓄势待发：双尺寸屏幕亮相影
• 智己LS9新车型携两款版本上市，Hyper版三电机四	• OPPO子品牌策略调整：realme主攻海外一加深耕
• WAIC未启已沸：门票紧俏、活动扎堆，投资圈共赴	• OPPO战略调整：realme主攻海外一加深耕国内，三
• 商务部回应“H200流入中国”：情况不了解，国内	• 三星Galaxy Z Flip新专利曝光：曲面屏搭配360度
• HMD持续发力：第二代模块化手机Fusion 2开发中	• 兆易创新携手地瓜机器人共推“高性能计算+实时