蚂蚁集团近日正式推出一款名为“灵光”的全模态通用AI助手,这款产品以“让复杂变简单”为核心理念,在移动端实现了“自然语言30秒生成小应用”的突破性功能。用户不仅可以通过对话生成可编辑、可交互、可分享的内容,还能体验到3D模型、音视频、图表、动画等全模态信息输出的创新交互方式。目前,该产品已同步上线安卓与苹果应用商店,成为行业内首个具备全代码生成多模态内容能力的AI助手。
“灵光”首批上线三大核心功能,其中“灵光对话”通过结构化思维重构传统问答模式。系统不再简单堆砌文字,而是像策展人一样设计对话流程,将逻辑梳理与可视化呈现相结合。例如在教育场景中,当用户询问复杂知识点时,AI会分层展示内容,并自动生成3D实物动图或交互式表格,使抽象概念变得直观易懂。这种设计既保证了信息传递的准确性,又通过动态3D模型、可操作地图等元素提升了交互趣味性。
支撑这种极简交互体验的是底层技术突破。产品构建了多智能体协作的Agentic架构,能够动态调度图像生成、3D建模、动画渲染等专用模块。所有呈现的图表、动画甚至完整应用组件,均由模型根据对话情境实时生成,而非调用预设模板。这种全代码生成能力使得每次响应都具备独特性,同时确保了输出内容与用户需求的精准匹配。
最具创新性的“闪应用”功能将AI开发门槛降至零。用户只需在对话中输入需求,系统便能在1分钟内生成定制化工具,最快30秒完成从概念到可操作应用的转化。无论是健身计划生成器、旅行路线规划器,还是个性化食谱推荐系统,都能通过自然语言指令快速创建。以“溏心蛋时间计算器”为例,用户可自由调整鸡蛋大小和熟度参数,获得精准烹饪方案;在养车场景中,系统生成的“成本计算器”能根据里程、油费等变量,动态生成最优养护策略。
这些动态应用突破了传统前端页面的限制,通过集成大模型后端能力实现了实时交互。当用户修改参数时,应用会立即重新计算并展示更新结果,这种“活应用”特性显著扩展了使用场景。在旅游场景中,“灵光开眼”功能搭载的AGI相机技术可实时解析视频流,用户对准建筑即可获取历史背景、结构解析等深度信息,同时支持文生图、图生视频等跨模态创作。
作为蚂蚁集团AGI战略的重要落地产品,“灵光”的推出标志着通用人工智能从技术突破向场景化应用的深度转型。其将应用开发流程无缝嵌入日常对话的设计,重新定义了AI助手的生产力边界。此前蚂蚁集团已通过AI医疗管家AQ、具身智能灵波科技等布局展现技术实力,此次新品的问世进一步验证了其在万亿参数模型研发与商业化落地方面的全链路能力。




