推广 热搜： 京东联通 iphone11 iPhone 摄像头网络安全自动驾驶企业存储 XSKY 京东智能采购

马斯克Grok 4.1强势登场，双榜登顶，AI领域格局生变！

日期：2025-11-18 作者：itcg 浏览：3083 我要评论

导读：马斯克Grok 4.1强势登场，双榜登顶，AI领域格局生变！

人工智能领域迎来重磅更新，马斯克旗下xAI团队推出的Grok 4.1大模型正式上线，并面向全球用户开放免费使用。这款新模型在智商与情商双维度实现突破，不仅在专业评测中登顶全球榜首，更通过多项技术优化显著提升了实用性能。

在核心性能方面，Grok 4.1推出Thinking和标准版双模式。Thinking模式在LMArena评测中以1483分刷新纪录，较第二名高出31分；标准版同样以1465分位列次席。值得注意的是，该模型在关闭深度推理功能后，仍能超越其他竞品开启全推理模式的表现。研发团队透露，后训练阶段的强化学习规模较前代扩大十倍，这是性能跃升的关键因素。

情绪智能成为新模型的突出亮点。在EQ-Bench3评测中，Grok 4.1以1586分创造新纪录，展现出卓越的共情能力。测试场景包含45个高难度角色扮演任务，模型需在三轮对话中准确捕捉用户情感变化。实际交互案例显示，当用户表达思念宠物的心痛感受时，模型不仅能识别情绪强度，还能通过渐进式对话提供情感支持，这种自然流畅的互动方式获得测试者高度认可。

创意写作领域同样见证显著进步。在Creative Writing v3基准测试中，新模型得分较前代提升600分。研发团队采用32个多样化写作提示进行三轮创作评估，结果显示Grok 4.1既能完成"尼古拉·特斯拉致未来"这类历史想象类文本，也能驾驭"AI觉醒后首发社交媒体"的现代叙事。生成的文案在逻辑连贯性、文化适配度和情感感染力等维度均达到专业作家水平。

事实准确性优化取得实质性突破。通过针对性强化训练，模型幻觉率较前代降低75%。在信息查询类任务中，新模型既能快速调用搜索工具获取实时数据，又能通过交叉验证机制确保信息可靠性。实际测试显示，当被问及"旧金山必游景点"时，模型不仅列出金门大桥、渔人码头等标志性景点，还能根据用户偏好推荐艺术博物馆或科技园区等特色去处。

技术团队披露了多项创新训练方法。在Colossus算力引擎支持下，研发人员开发出基于AI智能体的自动评估系统，该系统可模拟人类评审员对模型输出进行多维度打分。在为期两周的盲测中，64.78%的用户在对比使用后选择继续使用Grok 4.1。针对专业用户需求，模型还优化了窗口管理、系统配置等技术类问题的解答能力，在跨平台工具适配方面展现出显著优势。

目前该模型已上线网页端及iOS/Android应用，当前版本为beta测试版。研发团队强调，Grok 4.1在保持前代犀利风格的基础上，通过人格一致性优化增强了亲和力。这种"可靠专业又不失温度"的交互特质，使其在客服、教育、创意产业等场景具备广泛应用潜力。用户可通过官方平台体验模型各项功能，反馈数据将持续用于后续版本迭代。

ChatGPT openai

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

AWS多个数据中心瘫痪，因可能的无人机或导弹攻击而被关闭	苹果AI大动作：桌面机器人、智能音箱、家用摄像头齐上阵
北京现代EO（ELEXIO）试驾：家用纯电SUV驾驶体验舒适又稳健	OPPO无网通信再升级：图片传输成亮点，探索去中心化通信新潜力

相关资讯

• WAIC九年同行：林达华与商汤科技共绘AI从理想照	• 速腾聚创WAIC发布E2感知平台：精度跃升3倍，机
• AI搜索优化新路径：结构化数据助力品牌精准触达	• OpenAI推出ChatGPT Work及GPT-5.6系列模型，企
• 具身智能“ChatGPT时刻”尚远，数据瓶颈成通用	• GPT-5.6正式登场！ChatGPT与Codex融合，新功能C
• 中科曙光曙光8000投用：开启全国产十万卡AI超集	• Fedora“AI桌面”计划遇阻：社区反对声浪下项目
• Codex与ChatGPT合并背后逻辑何在？OpenAI团队负	• 智能体互联网迈向实践新阶段首套国家级标准体