推广 热搜： 京东联通 iphone11 iPhone 摄像头企业存储 XSKY 网络安全京东智能采购自动驾驶

OpenAI开源超稀疏模型Circuit-Sparsity：0.4B参数量解锁AI可解释性新路径

日期：2025-12-16 作者：itcg 浏览：2158 我要评论

导读：OpenAI开源超稀疏模型Circuit-Sparsity：0.4B参数量解锁AI可解释性新路径

OpenAI近日开源了一款名为Circuit-Sparsity的新型人工智能模型，该模型以极低的参数量和高度稀疏的权重矩阵，为解决大语言模型（LLM）的"黑箱"问题提供了全新思路。这款参数量仅0.4B的模型，其权重矩阵中99.9%的元素为零，仅保留0.1%的关键连接，这种设计使其内部计算路径变得清晰可追踪。

传统大模型普遍存在"概念纠缠"现象，单个神经元往往需要同时处理多个完全不同的任务，导致模型决策过程难以解释。OpenAI团队通过强制权重稀疏化，使每个神经元仅与特定神经元建立连接，从而在模型内部构建出类似电路的清晰计算路径。研究显示，在处理字符串闭合检测任务时，模型仅用12个神经元就构建出完整电路，每个神经元分别承担检测单引号、双引号或计数嵌套深度等特定功能。

技术实现层面，研究团队采用动态剪枝技术，在训练过程中持续保留绝对值最大的权重连接；通过AbsTopK激活函数强制保留前25%的激活值；同时用RMSNorm替代传统归一化层，避免破坏稀疏结构。这些创新使模型在保持性能的同时，电路规模较密集模型缩减16倍，显著降低了AI系统的理解难度。实验证明，移除电路关键节点会导致模型性能崩溃，而移除非关键节点则影响微弱，验证了电路设计的有效性。

尽管稀疏模型在可解释性方面表现突出，但其计算效率存在明显短板。由于稀疏矩阵运算无法利用GPU的Tensor Cores加速，实际运算速度比密集模型慢100-1000倍。针对这一瓶颈，研究团队提出"桥梁网络"方案，通过编码器-解码器结构在稀疏模型与预训练密集模型间建立映射关系。这种设计允许研究人员在稀疏模型上修改特定特征，再将扰动映射回密集模型，从而实现对现有大模型的解释性干预。

该研究在学术界引发广泛讨论。部分专家认为这项技术可能颠覆现有混合专家模型（MoE）的设计范式，将权重隔离到特定"专家"的传统做法或将被直接构建稀疏模型取代。也有观点指出，稀疏模型的训练成本较密集模型高出两个数量级，当前技术更适用于研究场景而非实际应用。OpenAI团队承认现有局限，但表示正在探索从密集模型中提取稀疏电路的技术路径，以及开发更高效的训练方法。

开源项目已同步发布在GitHub和Hugging Face平台，包含完整模型代码和训练日志。技术论文详细披露了动态剪枝、激活稀疏化等核心算法的实现细节，以及电路验证实验的完整数据。研究团队强调，这项工作尚处于早期探索阶段，未来计划将技术扩展至更大规模模型，并开发配套分析工具，使AI系统的评估与调试更加透明化。

智能 AI时代

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

苹果AI大动作：桌面机器人、智能音箱、家用摄像头齐上阵	北京现代EO（ELEXIO）试驾：家用纯电SUV驾驶体验舒适又稳健
OPPO无网通信再升级：图片传输成亮点，探索去中心化通信新潜力	成都无人机产业迎新机遇：发布146条机会清单，四大重点项目成功签约

相关资讯

• 经典再升级 \| 1.6-2.0吨林德高性能锂电平衡重叉	• 力箭一号遥十一火箭12月10日再创佳绩一箭九星
• AI学习平台Oboe获1600万美元A轮融资，上线三月	• 一加Ace 6T正式登场：与一加Ace6全面对比，升级
• 全国首推全自主无人化人形机器人导览方案，开启	• 双十二购机指南：三款国产旗舰手机性能卓越，综
• 全国首个！人形机器人“天工”全自主导览，开启	• QNX应对行业挑战：以创新产品与生态建设，助力
• 中科宇航力箭一号“一箭9星”成功发射迈入规模	• 《易经》智慧与AI碰撞：王文京揭秘中国人引领全