推广 热搜: 京东  联通  iphone11  摄像头  企业存储  XSKY  京东智能采购  iPhone  网络安全  自动驾驶 

零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型

   日期:2024-03-07     作者:itcg    浏览:711    我要评论    

IT采购网3月7日消息,近日,“零一万物01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。

据悉,Yi-9B模型的实际参数达到了8.8B,默认上下文长度更是高达4Ktokens。这款模型在Yi-6B的基础上进行了进一步的训练和优化,使用了0.8T tokens的数据进行精细调整,训练数据截至2023年6月。

在综合能力方面,Yi-9B模型表现出色,超越了众多同尺寸的开源模型,如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等。在代码能力上,Yi-9B仅次于DeepSeek-Coder-7B,但超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B等众多竞争对手。同时,在数学能力方面,Yi-9B也展现出强大的实力,仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型。

Yi-9B在常识和推理能力方面也表现出不俗的水平,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下。此外,官方还特别强调,无论是Yi-9B(BF16)还是其量化版Yi-9B(Int8),都能够在消费级显卡上实现轻松部署,大大降低了使用成本,对开发者来说非常友好。

据IT采购网了解,零一万物公司由李开复创新工场董事长兼CEO带队创办,此前已经成功推出了Yi-34B和Yi-6B两个开源大模型。该公司表示,他们对学术研究完全开放,并同步开放免费商用申请,以推动人工智能技术的广泛应用和发展。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯

头条阅读
推荐图文
相关资讯
网站首页  |  物流配送  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报  |  京ICP备14047533号-2
Processed in 0.075 second(s), 11 queries, Memory 0.45 M