2026年2月,具身智能领域迎来了一位重要人物的动向——许华哲宣布离开他参与创立的星海图,转而开启新的创业征程,成立破壳机器人公司,目标是将具身智能技术带入千家万户,切入C端市场。
许华哲在学术界和产业界均有着深厚的背景。他曾在伯克利取得博士学位,并在斯坦福进行博士后研究。此前,他是星海图的首席科学家兼联合创始人,同时也是清华大学交叉信息研究院的助理教授和具身智能实验室负责人。他提出的3D Diffusion Policy(DP3)架构,已成为业内广泛采用的3D视觉模仿学习框架之一。
当被问及为何选择在2026年这个时间点进入家庭机器人市场时,许华哲表示,这主要是基于对AI技术能力的判断。他认为,当前大模型和AI技术已经取得了显著进步,与五年前、十年前甚至三年前相比,已经不可同日而语。整个行业对机器人能否执行通用任务的预期已经被重新校准,现在正是进入家庭机器人市场的合适时机。
在产品规划上,许华哲提出了一个独特的策略:破壳机器人将首先专注于做好10件具体的事情,如物体传递、收纳和一定程度的清洁等,而不是追求完全泛化的能力。他解释说,这10件事虽然看似简单,但实际上需要高度的泛化能力。例如,收纳就包括收袜子、收衣服、收玩具等多种场景,每个家庭的情况都不尽相同。因此,破壳机器人需要训练一个能够处理各种收纳场景的通用模型。
许华哲强调,这并不意味着破壳机器人放弃了追求通用物理AGI的目标。相反,他认为这是一个技术上可行、又能真正交付给用户、同时不会造成安全隐患的平衡点。他举例说,即使技术上能够实现机器人给老人或儿童喂饭,但由于这一行为的风险太高,因此不会在产品初期就纳入功能范围。
在模型训练方面,许华哲透露,破壳机器人将训练一个从头到尾的模型,而不是基于现有模型进行后训练。他表示,这个模型需要具备足够大的容量以容纳现有的具身数据,同时要有预测能力以理解世界的演化规律。模型还需要支持短时间的后训练以快速获得新任务的能力。
对于家庭环境中的长程任务,如挂衣服等,许华哲表示,破壳机器人将采用端到端的训练方法。他认为,分层的路线虽然被广泛尝试,但存在诸多问题。而端到端的训练方法则更符合模型发展的方向,具有更长期的生命力。
在谈到强化学习在具身智能领域的应用时,许华哲表示,破壳机器人正在将强化学习规模化到上千台机器人上。他认为,规模化强化学习是提高采样能力、实现多任务学习的关键。同时,他也提到了在线学习的重要性,即模型在训练过程中需要不断适应新任务,同时保持对旧任务的性能。他表示,这是解决灾难性遗忘问题的关键。
在回答关于第一代产品交付时10件事的目标成功率时,许华哲表示,并没有一个具体的数字标准。他认为,与人类相近的成功率对机器人来说是必要的,这样用户才会觉得购买机器人是一件划算的事情。同时,他也提到了机器人在遇到无法解决的问题时的设计策略,包括柔顺控制、触觉感知和任务理解能力等。
从科学家到创业者的转变,许华哲表示,这一变化带来了更多的挑战和机遇。他提到,现在需要处理的事情更加多样和复杂,但这也促使他更快地成长。他认为,处理事情的复杂度在一定程度上决定了一个人的能力边界,因此他非常享受这种充满挑战的工作状态。
在谈及同时兼顾教职和创业的精力分配问题时,许华哲表示,他的精力将100%投入到物理AGI的研究和实践中。他认为,无论是在清华大学还是在破壳机器人公司,最终的目标都是推动物理AGI的发展。
在回顾从科学家到创业公司一号位的转变过程中遇到的困难时,许华哲提到了找办公室、决策维度变化和招人等挑战。他认为,这些具体的、不可加速的事情需要投入大量的时间和精力去处理。同时,他也提到了在招人过程中需要快速学习和评估不同领域人才的能力。




