如果你看过波士顿动力(Boston Dynamics)公司发布的机器人奔跑、跳跃和跑酷的视频,你可能会觉得机器人已经具备了惊人的敏捷性。
事实上,这些机器人仍然是经过了“手动”编程的(针对特定动作或任务),它们难以应对以前从未遇到过的新障碍。
然而,一种通过试错来教机器人运动的新方法可能有助于应对新场景,就像人类学习和适应不可预测的事件一样。
研究人员使用了强化学习技术,帮助一个名为 Cassie 的两足机器人在不同的地形上跑 400 米,并完成立定跳远和跳高动作。他们没有对每个动作进行明确的专项训练。
强化学习通过奖励或惩罚人工智能(模型)来实现目标。这种方法可以教会机器人在新的场景中进行能力的泛化并做出动作,而不是像传统方法训练出来的机器人那样不知所措。
“我们想突破机器人敏捷性的极限。”美国加州大学伯克利分校的博士生 Zhongyu Li 说,他参与了该项目,但(论文)尚未经过同行评审。“大目标是教机器人学会如何像人类一样做各种动态运动。”
该团队使用模拟来训练 Cassie,这种方法大大加快了它学习的时间,从几年缩短到几周,并使机器人能够在现实世界中完成同样的动作,而无需进一步微调。
(来源:HYBRID ROBOTICS VIA YOUTUBE)
首先,他们训练了控制 Cassie 的神经网络,使其从头开始掌握一项简单的技能,如原地跳跃、向前走或奔跑而不摔倒。它被鼓励模仿所展示的动作,其中包括人体动作捕捉的数据和所要完成动作的演示动画。
第一阶段完成后,该团队向模型展示了新的命令,鼓励机器人使用其新的运动技能执行任务。一旦它能熟练地在模拟环境中执行新任务,他们就会通过一种名为任务随机化的方法将训练过的任务多样化。
这使机器人对意外情况有了更多的准备。例如,机器人能够在被绳子拉向侧面的同时保持稳定的步态。Li 说:“我们让机器人能够利用观察到的历史,迅速适应现实世界。”
Cassie 以 2 分 34 秒的成绩完成了 400 米跑步,然后在不需要额外训练的情况下完成了 1.4 米的跳远。
接下来,研究人员将研究如何用这种技术训练配有摄像头的机器人。美国俄勒冈州立大学计算机科学教授阿兰·芬恩(Alan Fern)补充道,这将比没有摄像头来完成动作更具挑战性。他帮助开发了 Cassie 机器人,但没有参与该项目。
他说:“该领域的下一个重要进展是人形机器人,它们可以进行真正的工作,规划活动,并与物理世界进行更生活化的互动,而不仅限于跑步和跳远。”
支持:Ren
运营/排版:何晨龙
结论:
基于科学家们在机器人的自主运动方面的尝试,我们有理由相信机器人在未来会更加自由和灵活。这些结果表明,强化学习技术和模拟实验正在为教育机器人提供新的途径,使其能够更好地理解和适应新环境。
然而,这也提醒我们需要注意到,尽管AI模型在处理复杂任务时表现出色,但在面临未知或不断变化的场景时仍需要更多的人类干预和指导。此外,任何自动化工具都需要适当的测试和反馈机制来确保其性能和安全性。
对于未来的研究,我们可以考虑进一步探索如何优化强化学习算法,提高AI模型在面对不确定性和未知条件时的适应能力。同时,我们也需要加强对机器人行为和表现的研究,以便更好地理解它们的行为模式和潜在影响。
社会建议:
1. 在推动机器人技术发展的同时,也需要关注其伦理和社会影响。例如,如果机器人被用于工作岗位,是否会对人类就业造成威胁?如果机器人替代人类工作,那么如何保证劳动力市场的平衡?
2. 为了更好地管理和支持机器人,我们需要建立一套有效的法规和标准。这包括对机器人使用的监控和数据保护,以及对不当行为的责任追究等。
3. 对于科研人员来说,我们需要继续探索强化学习和其他新型技术,以期解决机器人面临的各种问题。