灵初智能发布分层端到端VLA+强化学习算法模型Psi-R1

2025-04-28 13:01:45 来源：

欢迎订阅《信阳手机报》移动用户发送短信 XYSJB 到10658300即可开通 3元/月不收GPRS流量费

近日，灵初智能发布的的分层端到端VLA+强化学习算法模型Psi-R1，已实现机器人在开放环境中的长程灵巧操作能力，达成了30分钟+持续CoAT超长任务时长，同时验证了三重复合交互能力（人-机交互、机-机交互、机-环境交互），体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

理论上，只有具备L3（即基于Chain of Action Thought（CoAT）框架的自主推理系统）的长程CoAT灵巧操作能力，才能理解世界，并将学到的知识迁移到新的环境中落地。灵初智能凭借其分层端到端VLA+强化学习算法模型Psi-R1，以麻将为场景，展现了机器人在开放环境中的长程灵巧操作能力，达成了30分钟+持续CoAT超长任务时长，同时验证了三重复合交互能力（人-机交互、机-机交互、机-环境交互），体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

这项突破性成果标志着具身智能从单一动作执行向完成复杂物理世界感知、推理和执行闭环的关键跃迁，为具身智能真正进入商业场景提供了可落地的技术范式。

在24年成立之初，灵初智能率先提出分层端到端快慢脑架构技术路线，如今已成为行业共识；而此次发布的Psi-R1快慢脑架构，不仅可实现模态对齐，结合强化学习达到具身Aha Moment，更是回应了并一定程度解决了Nvidia机器人高级总监及华盛顿大学教授 Deiter Fox对快慢脑架构存在两个核心问题（即，如何连接快慢脑、实现慢脑规划和快脑操作的模态对齐；如何突破模仿学习的瓶、训练丰富技能）。