双灵巧手引领智能革新:全面升级端到端智能体验【2024年12月】
智慧科技
12月30日消息,灵初智能推出了首个采用强化学习(RL)技术的端到端具身模型PsiR0。
获悉,该模型支持双灵巧手协同执行复杂操作任务,能够将多种技能串联并混合训练,从而生成具备推理能力的智能体,进而完成并闭环长程灵巧操作任务。此外,PsiR0还能够在跨物品和跨场景级别上实现泛化。
在电商领域,商品打包是一项繁琐且耗时的任务,需要处理上万件商品的抓取、扫码、放置以及塑料袋打结等多道工序。最近,PsiR0机器人凭借其双灵巧手的出色表现,成功完成了这些复杂的操作。据官方表示,PsiR0可以在客户现场替代一个人工工位来完成这些任务。值得一提的是,PsiR0是首个通过强化学习训练而实现长程灵巧操作的具身机器人,这标志着人工智能技术在实际应用中的重要突破。 这种创新的技术不仅极大地提高了工作效率,还减少了人工错误和劳动强度,为电商行业提供了新的解决方案。随着技术的进步,我们可以期待未来会有更多类似的智能机器人进入各个行业,从而推动整个社会向更高水平的自动化和智能化发展。
官方表示,基于 RL 的 Psi R0 模型,使用海量仿真数据训练出双手操作的智能体,并通过双向训练框架串联多技能,在业界率先完成开放环境中的长程任务,具备较强的泛化能力与较高的鲁棒性(robustness)。
这项技能训练框架通过从物体的时空轨迹中提取关键信息,进而构建通用的目标函数,有效解决了奖励函数难以设计的问题。在后续的训练过程中,只需利用少量高质量的实际机器数据进行校准,便能显著提高长期任务的成功率。 这种技术的应用无疑为机器人学习领域带来了新的突破。它不仅简化了复杂任务的设计过程,还大大提高了机器人的适应性和灵活性。特别是在需要长时间连续操作的任务中,该框架能够确保机器人更加精准地完成任务,极大地提升了工作效率。未来,随着更多高质量数据的加入和算法的不断优化,我们有理由相信这类技术将在更多领域得到广泛应用,推动智能化进程加速发展。
除此之外,双向训练框架中的转移可行性函数在提升技能微调方面表现突出。它不仅提高了技能串联的成功率与泛化性,还赋予了模型自主切换技能的能力。这意味着在遇到操作失败时,模型可以迅速调整策略,从而确保高成功率。这种机制对于增强人工智能系统的适应性和灵活性至关重要。特别是在当前快速发展的技术环境中,这样的创新为人工智能的应用开辟了新的可能性,使得机器能够在复杂多变的任务中表现出更加出色的性能。