在MEET2026智能未来大会上,高通公司AI产品技术中国区负责人万卫星分享了关于终端侧AI与混合AI的前沿思考。他指出,AI应用正经历从感知到生成,再到智能体,最终迈向物理AI的演进过程。目前,行业正从生成式AI向智能体AI过渡,这一转变标志着AI技术向更自主、更复杂的方向发展。
万卫星将AI应用的演进划分为四个阶段。感知AI作为基础阶段,已在终端设备中实现广泛应用。随着ChatGPT等技术的兴起,生成式AI成为第二阶段,其核心是通过大规模数据预训练,在人类监督下完成特定任务,如文本生成、图像创作和翻译等。第三阶段是智能体AI,它能够在无需人类干预的情况下自主行动、预测意图并编排任务。目前,产业正处在这一关键跃迁期。第四阶段为物理AI,AI将具备理解真实物理世界并做出相应反馈的能力,这一领域尚处于研究初期。
终端侧AI的发展呈现出显著趋势。模型尺寸不断扩大,手机已支持近百亿参数的模型部署,PC支持约200亿参数,车载场景则可支持200亿至600亿参数。模型质量同步提升,支持思维链和推理能力的模型已能在端侧运行。上下文处理能力从两年前的1K-2K增长至今年的8K-16K,特殊场景下甚至可实现128K的端侧部署。模态方面,终端AI正从单一文字向文本、图片、视频、音频等多模态,乃至全模态交互演进。
端侧运行AI的优势在于个性化服务。数据在终端产生,本地推理既保护隐私又无需联网,且完全免费。然而,这一模式也面临挑战:终端内存限制模型参数量,带宽影响推理速度,高集成度设备的功耗控制尤为关键。为突破这些瓶颈,高通通过量化压缩技术将模型精度从8 bit降至2 bit,显著减少内存占用;采用并行解码技术提升token生成速率;利用先进NPU和异构计算架构推动AI服务从被动响应向主动个性化转变。
智能体AI的典型用例展现了其复合性与主动性。例如,用户可通过自然语言指令智能体发布微博:系统理解意图后,自动打开应用、搜索照片、添加滤镜并完成发布,全程无需人工干预。用户还能通过交互监测回复并执行点赞或评论等操作。这一用例在骁龙峰会上全程端侧运行,验证了技术可行性。高通的芯片已覆盖智能眼镜、PC、汽车、手表和IoT设备,支持骁龙设备间的智能互联。算力较小的设备可通过连接手机或汽车,共享本地数据,实现分布式个性化推理。
混合AI被视为未来发展方向。终端侧运行垂类高效模型,提供安全、个性化的服务;云端部署大尺寸模型,提供通用、强能力的支持。高通凭借低时延、高速且安全的连接技术,确保端云协同与连接,为AI体验的升级奠定基础。




