推广 热搜: 京东  联通  iphone11  iPhone  摄像头  企业存储  网络安全  XSKY  自动驾驶  京东智能采购 

国产大模型新动态:OpenRuter现双雄,DeepSeek V4发布在即引期待

   日期:2026-03-12     作者:itcg    浏览:2332    我要评论    
导读:国产大模型新动态:OpenRuter现双雄,DeepSeek V4发布在即引期待

近期,国产大模型领域动态不断,此前备受瞩目的DeepSeek V4虽多次传出发布消息却均未成真,而如今又有两款新大模型在OpenRuter平台引发广泛关注与热议。

此次出现在OpenRuter平台的是两个不同型号的大模型。其中一个代号为Hunter Alpha,拥有高达1万亿的参数量,支持1M上下文,并且具备多模态输出能力;另一个代号Healer Alpha,其上下文为262k,同样支持多模态,不过参数量未对外公布,但输出速度相对更快。

对于Hunter Alpha,不少人猜测它就是即将发布的DeepSeek V4。然而,AI大模型评测领域的知名人士@karminski - 牙医却表示,Hunter Alpha并非DeepSeek V4,而是智谱的新模型,极有可能是智谱新一代的旗舰大模型。从DeepSeek过往发布新品的风格来看,这种猜测似乎也有一定道理。DeepSeek在发布新品前,通常不会在Openruter这样的平台进行测试,而是习惯低调上线,之后仅在群里发布一条简短消息来确认新品发布。

尽管DeepSeek V4尚未正式发布,但网络上关于它的各种传闻却层出不穷。有传闻称,DeepSeek V4拥有1万亿参数量,MOE激活320亿参数,支持1M上下文,具备原生多模态能力,并且针对昇腾910C平台进行了优化,并非仅局限于为NVIDIA或者AMD等国外芯片优化。不过,这些爆料的可信度有待考量。

相比之下,有一条爆料显得更具可信度。知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek - V4 - INT8权重,这一举动暗示了DeepSeek V4支持INT8算法,更重要的是,这似乎意味着DeepSeek V4的发布已经进入倒计时。

还有消息透露,DeepSeek要求供应商在6 - 20号期间保持稳定,并且最近两天还在进行最后的压力测试。种种迹象表明,DeepSeek V4或许很快就会与大家见面,大家不妨耐心等待。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
0相关评论

头条阅读
推荐图文
相关资讯
网站首页  |  物流配送  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报  |  京ICP备14047533号-2