大晓机器人近日正式对外发布其开源的具身原生世界模型——Kairos 3.0-4B,这一模型以“多模态理解—生成—预测”一体化架构为核心,专为具身智能场景设计,能够在端侧直接驱动机器人本体完成复杂任务,标志着具身智能技术向实际应用迈出了重要一步。
据官方介绍,Kairos 3.0-4B在Jetson Thor T5000端侧平台上展现出接近实时的生成能力,支持生成最长可达7分钟的连贯动态视频,为机器人任务规划与仿真训练提供了高效工具。这一特性使得机器人能够在更接近真实的环境中进行预演和优化,从而提升执行任务的准确性和效率。
在性能对比方面,基于A800 GPU的基准测试结果显示,Kairos 3.0-4B的推理速度较Cosmos 2.5有显著提升,达到约72倍。尽管模型参数规模为4B,显存占用约23.5GB,但这一数据仍低于部分主流具身世界模型,同时保持了较高的推理效率,体现了其在资源利用上的优化能力。
Kairos 3.0-4B的另一大亮点是其跨机器人本体的泛化能力。该模型能够适配单臂、双臂及灵巧手等不同形态的机器人设备,并兼容多种机器人硬件平台,为机器人技术的多样化和普及化提供了有力支持。这种泛化能力使得模型能够广泛应用于不同场景,满足不同用户的需求。
在具身智能评测基准中,Kairos 3.0-4B同样表现出色,在PAI-Bench-robot、WorldModelBench-robot TI2V等多项测试中均取得领先成绩。开发团队表示,该模型不仅可用于生成仿真训练数据,还能直接驱动机器人执行真实任务,这一特性将极大地推动具身智能从仿真环境向实际应用的转化。




