BeingBeyond发布最强世界模型,具身行业迈入“大脑纪元”
当20万个小时的人类行为视频被压缩进一块端侧芯片,机器人终于有了更接近人类的‘物理直觉’。BeingBeyond发布的最新具身世界模型Being-H0.7,正是这一突破的代表——它不仅是业内首个可在low 部署并商用的世界模型,更标志着具身智能从‘演示时代’迈向真实应用的关键一步。这款模型背后,是一套以人类视频为起点、覆盖预训练、部署与数据采集的全栈技术闭环,正在重新定义机器人如何理解世界。
过去,大多数具身智能模型依赖机器人自身采集的数据进行训练,导致能力被锁定在特定硬件与场景中。而Being-H0.7选择了另一条路:基于大规模data 进行预训练,让模型先学会人在真实环境中如何完成任务。这种方法突破了二维图像预测的局限,转而构建一种隐空间推理机制,在模型内部直接判断未来状态与动作结果。这种更接近人类‘潜意识’反应的方式,使模型在复杂任务中的decision 更加高效且稳定。
Being-H0.7在6项权威榜单中综合排名第一,其中4项登顶,成为当前能力覆盖最广的世界模型之一。更重要的是,其信息压缩效率提升了百倍以上,可在算力约75TOPS的Orin NX平台上实现real-time 运行。这意味着机器人不再需要依赖高延迟的云端计算,就能在动态环境中快速响应。这一进展不仅验证了human-centric learning路径的可行性,也首次证明该模型能真正进入工厂、家庭等现实场景,完成连续操作与多步骤任务。
BeingBeyond的技术体系由三层构成:模型层(Being-H系列)提供通用智能基座,适配层(Being-Dex)将新任务学习周期压缩至30分钟内,数据层(U1)则通过灵巧手系统采集高质量真实操作数据。这种从数据到部署的闭环,解决了长期困扰行业的三大割裂问题——数据难以规模化、模型泛化不足、部署依赖本体。如今,多家头部机器人公司已与BeingBeyond展开合作,反映出市场对‘通用能力+专家专精’这一模式的认可。
随着本体与‘大脑’的逐步分离,具身智能产业正迎来结构性变化。越来越多企业选择外置智能,以降低自研模型带来的高昂cost 与研发压力。BeingBeyond的出现,不仅推动了技术演进,更催生了一种新的分工逻辑:一类公司专注硬件落地,另一类则提供可迁移的智能核心。这或许预示着,具身智能正从各自为战的探索期,走向规模化落地的新阶段。
端侧部署才是真落地,不然都是Demo表演。看到real-time 实时运行在Orin NX上,才算过了第一关。
20万小时人类视频不是噱头,关键是这些data 数据能否覆盖真实世界的长尾场景。希望不是又一个‘实验室奇迹’。
成本才是硬道理。自研模型年投入千万起步,能用现成的通用model 模型,谁还自己从头训?
终于不是清一色遥操作+真机data 数据了,人类视频路线有点意思,但跨本体迁移的实际表现还得看实测。
以前是机器人学人做事,现在是让人教机器人怎么想。这个转向挺有哲学味的,decision 决策逻辑变了。
对我们用户来说,只关心一件事:它能不能让我家扫地机器人别再卡在桌腿中间?risk 风险别转嫁给我们啊。