推广 热搜: 京东  联通  iphone11  iPhone  摄像头  企业存储  网络安全  XSKY  自动驾驶  京东智能采购 

国产万亿参数大模型再次爆发 但还不是DeepSeek V4

   日期:2026-03-12     作者:itcg    浏览:1959    我要评论    
导读:国产万亿参数大模型再次爆发 但还不是DeepSeek V4

3月12日消息,作为国产大模型中最受期待的明星,DeepSeek V4最近一直被传发布,但都落空了,现在又有新的大模型引发热议。

这次又是在OpenRuter平台出现的,而且是两个型号,一个代号Hunter Alpha,1万亿参数量,而且支持1M上下文,多模态输出。

另一个代号Healer Alpha,262K上下文,也是多模态,但没有公布参数量,输出速度更快。

很多人猜测Hunter Alpha就是即将发布的DeepSeek V4,但AI大模型评测大佬@karminski-牙医表示它不是V4,还是智谱的新模型,可能是智谱新一代旗舰大模型。

如果了解过DeepSeek的风格,大家也应该认为不是V4,DeepSeek发布新品之前没有在Openruter这样测试过,而是习惯低调上线,之后在群里发布一则简短的消息确认有新品。

DeepSeek V4这几天也有很多网传的新正经,比如1万亿参数量,MOE激活320亿参数,1M上下文,原生多模态,并且为昇腾910C平台优化,而不是只为NVIDIA或者AMD等国外芯片优化。

不过这些爆料可信度一般,目前比较可信一点的反而是下面这一条:知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek-V4-INT8权重,暗示了V4支持INT8算法,更关键的是这意味着V4这次真的差不多要发布了。

还有爆料说DeepSeek要求供应商在6-20号期间保持稳定,最近两天还在做最后的压力测试,很快就能发了。

反正耐心等等吧,好饭不怕晚。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
0相关评论

头条阅读
推荐图文
相关资讯
网站首页  |  物流配送  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报  |  京ICP备14047533号-2