近日,DeepSeek官方宣布其线上版本模型已成功升级至DeepSeek V3.1,此次升级的一大亮点是上下文窗口从原先的64k扩展到了128k,用户现在可以在网页、App以及小程序中体验到这一新版模型。
值得注意的是,DeepSeek在App和网页端的界面上也做了一些调整,将原先的“深度思考(R1)”字样简化为“深度思考”。这一变化引发了网友们的猜测,认为这是DeepSeek可能正在融合推理模型与非推理模型的信号。然而,截至目前,DeepSeek官方尚未就此发表任何正式声明。
新版与旧版界面的对比图显示,左侧为旧版页面,右侧则是新版页面,变化一目了然。
DeepSeek V3.1模型已经上传至Hugging Face平台,目前开源的是未经指令微调的Base版本,包括配置文件、脚本代码和模型权重等均可供用户下载。与之前的DeepSeek-V3-0324版本相比,新模型的参数量和张量类型并未发生显著变化。
在实际体验中,DeepSeek V3.1在多个方面展现出了能力的提升。例如,在编程领域,尤其是前端开发方面,新模型能够生成更长、更复杂的代码,并且在美观性和完成度上也有了显著提升。当要求设计一个具有科技感的个人博客网站时,DeepSeek V3.1不仅提供了更为丰富的网站栏目规划,还加入了图片等元素,使得整个网页的布局更为合理,重点更为突出。
DeepSeek V3.1在小游戏开发方面也表现出了一定的实力。尽管在复现Chrome浏览器断网时的小恐龙游戏时,新模型打造的小恐龙外观并未完全还原,且游戏可玩性有待提高,但从页面的画风和游戏规则来看,这一小游戏已经与原版颇为相似。
在回答小众历史问题时,DeepSeek V3.1也展现出了其严谨性。当被问及“布须曼人喝牛奶吗”这一涉及非洲南部少数民族的问题时,新模型不仅提供了更为详细的信息,而且在经过事实核查后,这些细节也基本得到了印证,避免了胡编乱造的情况。
在回答关于马斯克和OpenAI CEO Sam Altman谁更牛的问题时,DeepSeek V3.1虽然认为马斯克更牛,但也给Altman送上了一番夸赞,避免了非黑即白的结论,显得更为客观和中立。
在诗歌创作方面,DeepSeek V3.1依然保持着其独特的风格,充满了各种比喻和类比,让人耳目一新。而在数学能力上,尽管新模型在解答基础算术题时过程有些曲折,但最终还是给出了正确答案,展现出了其强大的计算能力。
DeepSeek V3.1的上线也引发了网友们的热议。有AI博主表示,新模型打造的小球跳动效果更加符合物理定律,且提供了重力、摩擦、旋转速度、弹跳等可调整的参数,使得效果更为逼真。还有网友让DeepSeek V3.1为自己打造了一幅自画像,虽然画风独特,但也别有一番风味。