推广 热搜: 京东  联通  iphone11  摄像头  iPhone  企业存储  XSKY  京东智能采购  网络安全  自动驾驶 

清华90后创业者季宇发布“褐蚁”一体机,挑战AI算力市场

   日期:2025-05-01     作者:itcg    浏览:1479    我要评论    
导读:清华90后创业者季宇发布“褐蚁”一体机,挑战AI算力市场

近日,北京行云集成电路有限公司(简称“行云集成电路”)在AI领域引发了广泛关注。这家由清华90后创立的公司,宣布推出了一款名为“褐蚁”的全新一体机产品,旨在以最高15万元的价格,提供满血版DeepSeek R1/V3大模型的运行能力,同时实现了20token/s的对话速度。

行云集成电路的创始人兼CEO季宇,在接受采访时透露,“褐蚁”一体机已经成功支持了阿里最新发布的Qwen3系列开源大模型,包括其顶配版Qwen3-235B-A22B。季宇本人是清华大学物理系本科及计算机体系结构方向博士,并曾荣获“华为天才少年”称号,拥有丰富的AI芯片研发经验。

“褐蚁”一体机提供了三款不同配置,其中最高性价比的“超大杯”版本HY90,搭载了双路AMD EPYC 9355服务器、24条48G 6400M内存和NV 5090D计算卡。在FP8数据精度下,它能够以21token/s的速度运行满血版DS,而在INT4精度下则能达到28token/s,并支持最高128K的上下文处理,售价仅为14.9万元。行云集成电路还计划推出“大杯”HY70和“中杯”HY50两个配置版本。

季宇团队通过独家优化推理引擎,显著提升了推理效率,使得“褐蚁”成为国内首个在10万元价位提供满血FP8精度模型、速率超过20tps的一体机产品。该产品还支持配置各类调用大模型API的应用,为用户提供了极大的便利。

行云集成电路成立于2023年8月,其核心团队汇集了来自清华大学及全球顶尖芯片公司的精英。公司致力于研发下一代针对大模型推理场景的高效能GPU芯片,以推动AI技术的进一步发展。除了季宇外,公司CTO余洪敏也是核心团队的重要成员。

季宇在华为期间曾负责多个昇腾编译器项目,并在AI编译器领域和处理器微架构领域取得了诸多突破性成果。他的加入无疑为行云集成电路注入了强大的技术实力。2024年11月,行云集成电路宣布完成了总额数亿元的天使轮及天使+轮融资,吸引了多家知名投资机构的参与。

随着AI技术的快速发展,一体机产品在市场上逐渐崭露头角。相比复杂的云计算解决方案,一体机具有部署简单、项目落地周期快、私有化安全性高、价格更具性价比等优势。然而,一体机也面临着持续维护、升级以及大规模数据调度等挑战。随着大模型的快速演进,一体机的硬件和技术能力也需要不断更新和升级。

尽管面临诸多挑战,季宇对“褐蚁”一体机的未来充满信心。他表示,该产品目前仍能支持超大杯的MoE模型和30b当量的dense模型,后续模型迭代并不会对其造成太大影响。相比其他一体机产品,“褐蚁”在显存、KTransformers等层面拥有更多的技术研发能力。

展望未来,行云集成电路计划自研GPU卡,以进一步降低成本并提高tps体验。同时,公司还将实施由30台“褐蚁”一体机组成的“蚁群”方案,以发挥分布式系统优化能力,支持500-1000的有效并发数,并将价格降至300万-400万元之间,低于英伟达HGX H200集群的整体硬件成本。

随着国内AI算力行业的快速发展,越来越多的人投身于一体机、AI Infra以及GPU服务器等算力“卖水人”的工作。然而,随着推理模型技术的迅猛进步,大规模算力投入也引发了诸多质疑。未来,国内AI算力行业是否会经历大浪淘沙,最终仅剩下大厂及头部的几家企业,还是会有更多人继续“卷”性价比,这仍然是一个值得观察的问题。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
0相关评论

头条阅读
推荐图文
相关资讯
网站首页  |  物流配送  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报  |  京ICP备14047533号-2