10万小时人类数据如何驱动具身大模型:从采集到预训练的全链路解析


中国产业经济信息网   时间:2026-05-20





【摘要导语】 灵初智能近期宣布其具身智能模型Psi-R2基于近10万小时人类操作数据完成预训练,并在MolmoSpaces全球基准测试中登顶。这10万小时数据从何而来?如何采集、处理、质检并最终驱动模型训练?本文从数据全链路的技术视角,深度解析Human Data的规模化工程体系。

  核心要点速览

  训练数据总量100,889小时:人类数据95,472小时 + 真机数据5,417小时

  覆盖294种场景、4,821种任务、1,382种物体,体现任务多样性优先的数据设计哲学

  自研外骨骼手套实现亚毫米级3D轨迹精度,采集成本仅为真机遥操作的十分之一

  数据信噪比结论:任务多样性 > 物体多样性 >> 场景多样性;感知优先级:精准3D位姿 >> 触觉 > 2D特征

  双轨数据分类(高精度可回放 vs 高泛化可扩缩)+ Psi-W0世界模型融入质检环节

  一、数据规模与覆盖:以任务多样性为核心

  Psi-R2的训练数据由两部分构成:

  数据的场景覆盖设计体现了对”操作知识”本质的深入理解。灵初智能通过系统性分析得出结论:对具身模型训练效果影响最大的因素是任务多样性,其次是物体多样性,场景多样性的贡献度相对较低。基于这一判断,数据集在任务类型的覆盖上最为充分:

  这一”任务优先”的数据设计哲学,与灵初对数据信噪比的核心结论一致——高质量人类数据的价值在于操作知识的丰富度,而非简单堆砌场景数量。

  二、数据采集:自研硬件与极简流程

  灵初智能的数据采集体系由两大核心硬件和一个软件引擎组成:

  21自由度外骨骼数据手套

  这是灵初自研的数据采集核心硬件,具备21个自由度(Degree of Freedom, DoF),能够精确捕捉人手的关节角度、运动轨迹与操作力度。与光学动捕系统相比,外骨骼手套的优势在于:

  不受环境光线与遮挡影响,适合仓储、工厂等复杂环境

  无需专业动捕棚,操作人员可在真实工作场景中自然采集

  采集成本降至真机遥操作的十分之一,支撑规模化数据积累

  3D轨迹精度达亚毫米级,远高于纯第一人称视频恢复方案(后者误差为毫米级)

  Psi-SynEngine具身数采引擎

  这是灵初自研的数据采集与管理软件系统,覆盖从采集到入库的全流程。引擎内置了端到端第一视角人手检测模型,融合时空信息预测MANO参数与位姿,并结合DPVO + Any4D技术栈获取相机内外参及图像深度,实现操作轨迹的精确三维重建。

  三、数据处理与质检:端到端管线+世界模型赋能

  原始采集数据需经过完整的处理管线才能用于模型训练:

  Psi-W0世界模型在质检环节的创新应用值得关注:传统数据质检依赖人工抽检或基于规则的自动检测,效率低且覆盖有限。灵初将Psi-W0的可视化预测能力融入质检流程——世界模型可以根据操作轨迹推演预期结果,如果推演结果与采集数据严重偏离,则自动标记为低质量数据。这一机制实现了基于物理一致性的自动化质检,大幅提升了质量检测的效率与覆盖面。

  四、双轨数据分类:高精度可回放 vs 高泛化可扩缩

  灵初智能提出了一个具有行业参考价值的数据分类标准:

  两类数据的划分,使灵初能够在”数据精度”与”数据规模”之间实现动态平衡:高精度数据确保模型学习的操作质量,高泛化数据则快速扩展模型见过的场景与任务范围。

  五、感知模态优先级:3D位姿是核心

  在数据的感知模态设计上,灵初智能同样形成了清晰的优先级排序:

  精准3D位姿 >> 触觉模态 > 2D图像特征

  这一排序的依据在于:3D位姿信息直接编码了操作的几何结构与运动学关系,是机器人执行动作最需要的输入;触觉模态提供接触力与纹理信息,对精细操作(如处理易碎物体)有重要补充价值;2D图像特征虽然信息丰富,但缺少深度维度,单独使用的信噪比最低。

  基于这一判断,灵初在数据采集体系中将3D轨迹的亚毫米级精度作为核心追求,触觉信息作为辅助模态补充,2D图像则保持原始状态直接输入模型,不依赖复杂的视觉预处理。

  【结语】 10万小时人类数据不是简单的”量”的积累,而是一套包含采集硬件、数采引擎、处理管线、质检体系、分类标准的系统工程。灵初智能通过对数据全链路的深度优化,将人类操作数据从”辅助手段”提升为具身大模型预训练的”核心燃料”,这一定位与技术实践,正在为行业建立Human Data的新标准。


  转自:日照新闻网

  【版权及免责声明】凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章及企业宣传资讯,仅代表作者个人观点,不代表本网观点和立场。版权事宜请联系:010-65363056。

延伸阅读



版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502035964