推广 热搜: 京东  联通  iphone11  iPhone  摄像头  企业存储  XSKY  网络安全  京东智能采购  自动驾驶 

蚂蚁集团发布万亿参数Ling-1T大模型

   日期:2025-10-10     作者:itcg    浏览:1409    我要评论    
导读:蚂蚁集团发布万亿参数Ling-1T大模型

蚂蚁百灵大模型Ling 2.0系列迎来里程碑式突破——其首款万亿参数旗舰模型Ling-1T正式亮相。这款非思考型通用语言模型凭借20T+tokens的高质量推理语料预训练,在复杂推理场景中展现出卓越性能,多项基准测试结果超越同类开源模型,甚至在部分指标上领先闭源头部产品。

在数学竞赛领域,Ling-1T以颠覆性表现刷新行业认知。以美国数学邀请赛(AIME 25)为例,该模型在平均消耗4000+Token的情况下取得70.42%的准确率,相较Gemini-2.5-Pro模型5000+Token消耗与70.10%准确率的组合,实现了单位Token推理效率的显著提升。这种在推理精度与计算成本间的完美平衡,使其成功拓展了该领域的帕累托前沿边界。

技术架构层面,Ling-1T延续Ling 2.0的模块化设计,支持最高128K上下文窗口处理。其创新采用的FP8混合精度训练技术,不仅使显存占用降低30%,更通过灵活的并行策略实现15%以上的端到端训练加速。这项被首次应用于万亿参数基座模型的技术突破,目前已有部分解决方案向社区开源。

在强化学习阶段,研究团队提出的LPO(Linguistics-Unit Policy Optimization)算法成为关键突破口。该算法以完整语义单元替代传统词元或序列作为优化粒度,有效解决了细粒度破碎与粗粒度笼统的双重困境,使奖励信号与模型输出的语义对齐精度提升40%。配合"语法-功能-美学"三维奖励机制,模型在代码生成任务中同时实现了逻辑正确性与视觉呈现的双重优化。

前端开发能力验证中,Ling-1T在ArtifactsBench基准测试取得59.31分,虽以微弱差距次于Gemini-2.5-Pro-lowthink的60.28分,但大幅领先其他开源模型。该模型在Vue/React组件生成、CSS动画实现等任务中展现的代码质量与视觉适配能力,已达到专业开发者水平。

值得注意的是,蚂蚁百灵团队同步推进的深度思考型大模型Ring-1T已取得重要进展,其preview版本于9月30日通过Hugging Face平台开源。开发者现可通过蚂蚁百宝箱等渠道同时体验Ling-1T与Ring-1T两款不同定位的万亿参数模型,感受非思考型模型的效率优势与深度思考型模型的逻辑纵深。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
0相关评论

头条阅读
推荐图文
相关资讯
网站首页  |  物流配送  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报  |  京ICP备14047533号-2