信阳新闻网欢迎您!

灵初智能发布分层端到端VLA+强化学习算法模型Psi-R1

2025-04-28 13:01:45 来源:
欢迎订阅《信阳手机报》移动用户发送短信 XYSJB10658300即可开通 3元/月 不收GPRS流量费

近日,灵初智能发布的的分层端到端VLA+强化学习算法模型Psi-R1,已实现机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,同时验证了三重复合交互能力(人-机交互、机-机交互、机-环境交互),体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。


理论上,只有具备L3(即基于Chain of Action Thought(CoAT)框架的自主推理系统的长程CoAT灵巧操作能力,才能理解世界,并将学到的知识迁移到新的环境中落地。灵初智能凭借其分层端到端VLA+强化学习算法模型Psi-R1,以麻将为场景,展现了机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,同时验证了三重复合交互能力(人-机交互、机-机交互、机-环境交互),体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

这项突破性成果标志着具身智能从单一动作执行向完成复杂物理世界感知、推理和执行闭环的关键跃迁,为具身智能真正进入商业场景提供了可落地的技术范式。


在24年成立之初,灵初智能率先提出分层端到端快慢脑架构技术路线,如今已成为行业共识;而此次发布的Psi-R1快慢脑架构,不仅可实现模态对齐,结合强化学习达到具身Aha Moment,更是回应了并一定程度解决了Nvidia机器人高级总监及华盛顿大学教授 Deiter Fox对快慢脑架构存在两个核心问题(即,如何连接快慢脑、实现慢脑规划和快脑操作的模态对齐;如何突破模仿学习的瓶、训练丰富技能)。

灵初R1模型已首度成功验证VLA Test-Time Scaling

灵初智能R1快慢脑系统具备L3能力,可在开放环境下自主推理决策,完成长程复杂操作,其技术得以广泛应用并已与制造业、商超零售、跨境物流等行业龙头企业展开合作,梯次布局高价值商业化场景,从泛工业向泛零售物流,再最终迈向家庭应用,并进一步探索具身智能的未知领域。


文章投诉热线:156 0057 2229 文章投诉邮箱:291 3236@qq.com

标签:

  • 报晓风
  • 信阳日报微信信阳日报微信
  • 掌上信阳微信
  • 信阳日报新浪微博
  • 信阳日报腾讯微博

请您文明上网、理性发言,并遵守相关规定。网友评论

验证码:

网友评论仅供其表达个人看法,并不表明信阳新闻网立场。

评论列表
还没有评论,快来抢沙发吧!
回到顶部

工信部备案:豫ICP备09044067号

河南省互联网新闻信息服务许可证 编号:01201517001

信息网络传播视听节目许可证 编号:1910522

豫公网安备:41159002000089号

河南省违法和不良信息举报中心

违法和不良信息举报受理和处置管理办法