
当科技浪潮奔涌至具身智能的关键转折点,一场聚焦行业智慧的思想盛宴在中关村学院拉开帷幕。4月17日,“中关村Xᴬᴵ智汇讲坛”系列之学术带头人论坛(第二期)如约而至,多位顶尖学者与行业先锋齐聚,以前沿视角剖析技术瓶颈,用创新方案探寻破局路径,为产学研协同发展注入强劲动力。

清华大学具身智能实验室负责人许华哲博士直击行业核心矛盾:多模态感知-动作耦合数据的稀缺与异构,正成为具身智能发展的“卡脖子”难题。真实场景中,物理交互数据采集面临成本与泛化双重挑战,机器人闭环操作往往需百万级数据积累,且跨场景迁移能力薄弱;触觉、视觉、力觉等多源数据的时空对齐与语义关联复杂度极高,仿真到真实场景的数据偏差更易导致模型失效。许华哲博士团队采用DemoGen技术扩充数据量,与传统方式相比,数据获取速度提升上万倍,进一步增强了机器人的泛化能力,为具身智能的优化升级提供理论支撑与实践指引。

在具身智能研究领域,赋予人形机器人多场景交互能力是核心攻关方向。然而,由于人形机器人具有复杂动力学特性、高维感知与控制需求,以及欠驱动特性,其技能学习面临巨大挑战。清华大学弋力博士团队另辟蹊径,利用人机形态相似性,创新性提出跨本体追踪控制范式,通过采集人类场景交互数据构建生成性规划器,使机器人掌握多样化交互技能。在交互运动数据捕获、生成性交互规划、跨本体追踪控制三大关键技术上的重要突破,展示了该范式在赋能机器人实现多场景、多样化交互任务的巨大潜力,为具身智能发展开辟新赛道。

具身智能长期受困于数据昂贵与样本不足的双重瓶颈,银河通用张直政博士带来颠覆性解决方案:以高质量合成大数据开创“大规模仿真数据预训练+少量真实样本后训练“新范式。以GraspVLA训练为例,其依托十亿帧“视觉-语言-动作”合成数据预训练,赋予模型泛化闭环抓取能力,经Sim2Real零样本测试展现七大核心优势;后续通过小样本学习,实现基础能力场景迁移,塑造专业技能。该方案有效打破真实数据采集成本高、覆盖不足及硬件迭代导致的数据浪费等困境,突破机器人泛化能力局限,为VLA模型多维度泛化及具身智能商业化落地指明方向。

圆桌论坛环节由陈志波老师主持,张直政、何天宇、邓翔、余金城、于超等各位行业专家学者与企业代表齐聚,围绕具身智能领域的技术突破、应用前景、产学研合作展开深入探讨。与会嘉宾从多元视角切入,聚焦大模型与机器人的技术融合路径、强化学习在决策智能中的实践应用、硬件与算法协同优化等研究重点,以及数据在具身智能中的关键作用,并提出通过混合数据源来推动具身智能发展的创新思路。同时,专家们特别强调,依托北京中关村学院和中关村人工智能研究院产学研一体化平台,通过开放合作、灵活机制与聚焦核心问题,将加速技术成果转化与创新人才培养,为行业发展注入持久动力。

“中关村Xᴬᴵ智汇讲坛”系列之学术带头人论坛(第二期)的成功举办,不仅凝聚了具身智能领域的前沿智慧,更为产学研深度融合架起了坚实桥梁,让创新思维碰撞出无限火花。未来,中关村两院将持续搭建高端学术平台,以“以终为始”的创新思维攻克行业难题,以高度的使命感培养兼具科研实力与产业视野的复合型人才,在时代浪潮中勇担重任。