摘要:人形机器人需要在训练中不断成长。12月27日,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合创建的具身智能数据集对外发布。有了这个数据集,像天工这样的具身智能机器人就可在持续训练中变得更“聪明”。
本报记者 曹政
人形机器人需要在训练中不断成长。12月27日,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合创建的具身智能数据集对外发布。有了这个数据集,像天工这样的具身智能机器人就可在持续训练中变得更“聪明”。
正如人工智能大模型需要海量文本数据来训练,想要培养出一个能力全面的机器人,也需要大量优质的训练数据。
“与视觉或语言数据的获取相比,收集机器人训练数据更困难。”国家地方共建具身智能机器人创新中心相关负责人解释,具身智能数据采集需要投入大量时间和资源进行机器人操作实践或仿真模拟,来收集视觉、触觉、力觉、运动轨迹,以及机器人本体状态等多源异构数据。
业内目前最具通用性的机器人操作策略主要依赖于在有限多样性条件下收集的数据。更加丰富多样的大规模多构型具身智能数据集和Benchmark(基准测试,用来评估和比较不同具身智能操作模型性能的一系列标准化测试和评估标准)是极为稀缺的资源。
为了解决这个难题,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出了一个大规模多构型智能机器人数据集和Benchmark——RoboMIND,捕捉机器人面对复杂环境、长程任务时的各种交互和经验,从而促进能够掌握不同操作策略的通用模型的训练。
据了解,RoboMIND是采用了单臂机器人、双臂机器人、人形机器人等多种形态的机器人本体进行数据采集,包含5.5万条机器人轨迹数据,涉及279项不同的任务多类场景,涵盖了61种不同类别的物体,覆盖了家居、厨房、工厂、办公、零售等大部分生活服务场景。
这就像小学生做习题来提高自己的学习能力,机器人的成长也需要见识各种“题型”。比如,RoboMIND数据集的61种不同物品类别,可以让机器人掌握更多本领。在厨房场景中,数据集不仅包括了草莓、鸡蛋、香蕉和梨子等常见食物,也包括了烤箱和面包机等复杂的可调节物体;在家庭场景中,数据集既包括了网球等刚性物体,也包括了玩具等可变形物体;办公和工业场景则包括了电池和齿轮等需要精确控制的小物体。
“多样化的物体种类不仅增加了数据集的复杂性,也有助于训练能够在各种环境下执行操作。”相关负责人举例,这样,不同形态的机器人才能更好地学会如何抓取不同的东西。
随着数据集建设的不断积累,该创新中心将持续迭代RoboMIND,涵盖更多本体、任务、场景和评测方法,提供高质量、标准化、广泛多样的数据基础。
来源:北京日报客户端