| S/N | 企业 | 代表模型 | 亮点 |
|---|---|---|---|
| 1 | 极佳视界 | GigaWorld-1具身世界模型 | 26年3月WorldArena首个综合得分突破60分的具身世界模型 |
| 2 | 流形空间 | Worldscape 0.2具身世界模型 | 26年4月WorldArena总分第一 |
| 3 | 中科第五纪 | FlowWAM世界行动模型 | 26年4月WorldArena总分第二、3D精度第一 |
| 4 | 生数科技 | Motubrain世界动作模型 | 26年4月WorldArena动作真实度、轨迹连贯性等维度第一 |
| 5 | 阿里巴巴 (高德) | ABot-PhysWorld具身世界模型 | 26年4月WorldArena视觉质量单项第一 |
| 6 | 理想汽车 | MindVLA-o1 VLA世界模型 | 首创预测式隐世界模型 |
| 7 | 智元机器人 | GE-Sim 2.0具身世界模型 | 首次实现可交互、可训练、可评估的具身世界模型 |
| 8 | 蔚来 | NWM生成式世界模型 | 国内首个量产落地的“认知+想象+推演”式智能驾驶大模型 |
| 9 | 星动纪元 | Ctrl-World具身世界模型 | 首个可控生成式世界模型 |
| 10 | 眸深智能 | HL3DWM世界动作模型 | 首个模仿人类空间认知范式的三维世界模型 |
| 11 | 小鹏汽车 | X-World生成式世界模型 | 自车中心、纯环视多相机、全层级可控、流式自回归 |
| 12 | 无界动力 | MWA™世界动作模型 | 隐空间原生世界模型+强化学习架构 |
| 13 | 跨维智能 | DexWorldModel仿真世界模型 | 26年4月RoboTwin仿真环境45项双臂操作任务成功率达94.00% |
| 14 | 大晓机器人(商汤科技) | 开悟 3.0具身世界模型 | 首个可在THOR端侧平台实时生成的具身世界模型 |
| 15 | 昆仑万维 | Matrix-Game 3.0世界基础模型 | 首款实现720p@40FPS实时交互的工业级AI世界模型 |
| 16 | 腾讯 | 混元3D世界模型2.0 | 开源多模态世界模型 |
| 17 | 小马智行 | PonyWorld 2.0世界模型 | 已深度集成于小马智行第七代Robotaxi |
| 18 | 酷哇科技 | Coowa WAM 2.0世界动作模型 | 通过“类人双流认知架构”实现物理世界的可推演决策 |
| 19 | LiberAI | 物理世界模型 | 采用UMI数据与物理世界模型研发范式 |
| 20 | 轻舟智航 | 轻舟物理AI模型 | 世界模型+强化学习双引擎架构 |
| 2026.05 DBC/CIW/eNet16 | |||
当大语言模型的热度逐渐消退,一场更深刻的技术革命正在悄然发生。世界模型,这个被杨立昆称为“通向AGI唯一可行路径”的技术,正在2026年迎来它的分水岭。
与大语言模型时代中美并跑、美国略占优势的格局不同,在世界模型这一全新赛道上,中国企业已经展现出了令人惊讶的领先态势。这种领先不是单点的技术突破,而是系统性的路线优势和产业协同优势。
追本溯源
在讨论中国企业的成就之前,我们必须首先厘清一个被严重混淆的概念:什么才是真正的世界模型。
当前市场上充斥着大量“伪世界模型”:将3D资产生成工具包装成世界模型,将视频生成模型嫁接上3D能力就宣称实现了世界理解,甚至将传统的数字孪生可视化系统也冠以世界模型的名号。这些产品或许在各自的领域有其价值,但它们与真正的世界模型有着本质的区别。
真正的世界模型,其终极目标不是静态的“生成”,而是动态的“预测”与“行动”。无论技术路线如何,评判标准都在于它能否让AI像人类一样,在头脑中预演物理世界的可能性并指导行为。
它不是一个用来制作漂亮3D画面的工具,而是智能体用来理解物理世界、预测未来变化、规划自身行动的“内部大脑”。一个合格的世界模型必须具备物理规律的隐式理解、时空一致性、感知-预测-行动闭环这三个核心特征。
用这个标准来衡量,我们会发现,真正在世界模型核心技术上取得突破的企业,绝大多数都是中国的创业公司。
中国方案
当前全球世界模型主要分为预测驱动、内容生成、动作驱动三大技术路线。
在很长一段时间里,预测驱动和内容生成路线被认为是世界模型的主流。动作驱动路线则直接跳过了不必要的像素生成步骤,将所有的计算资源都集中在“理解物理交互”和“生成最优动作”上。
这种路线不仅效率更高,在逻辑上也更接近生物智能的本质——人类在行动时,并不需要在脑中渲染出高清3D电影,而是基于对物理世界的直觉理解,直接产生肌肉反应。它跳过了“视觉皮层的华丽渲染”,直接进入了“小脑和运动皮层”的实时决策。正是在这条更接近智能本质的路径上,中国企业做出了关键性的探索。更重要的是,它解决了世界模型从“能看”到“能动”的最关键一步。
一个非常值得关注的现象是,在世界模型这一赛道上,领跑的不是腾讯、阿里、百度这样的互联网大厂,而是众多成立不到3年的创业公司。这与大语言模型时代形成了鲜明的对比。在大语言模型时代,大厂凭借算力和数据优势占据了主导地位。但在世界模型时代,创业公司却展现出了更强的创新活力。
这一方面是由于技术路线的颠覆性。大厂在大语言模型上积累的技术优势和组织惯性,以及众多的业务线,反而成为了它们转型的负担。创业公司没有历史包袱,可以从零开始构建最适合世界模型的技术架构。
另一方面,与大语言模型时代主要由财务资本推动不同,世界模型时代的投资主力是产业资本。顺丰、三星、阿里、吉利、联想等众多产业巨头集体投资,这种深度的产业绑定不仅为创业公司提供了充足的资金,更重要的是,为它们提供了宝贵的真实场景数据和落地渠道。
除此以外,中国企业在动作驱动路线上的领先不是偶然的。中国拥有全球最大的制造业基础和最丰富的机器人应用场景,这为动作驱动世界模型提供了得天独厚的训练数据和落地环境。
结语
世界模型不是大语言模型的续集,而是人工智能的新篇章。它将AI从“理解语言”推向了“理解世界”,从“虚拟世界”推向了“物理世界”。这是一场比大语言模型更深刻、更具颠覆性的技术革命。
在这场革命中,中国企业第一次站在了全球技术创新的最前沿。这不是偶然的运气,而是中国完整的产业链、庞大的市场需求和强大的工程能力共同作用的结果。
未来十年,世界模型将重塑几乎所有的行业。从工业制造到交通运输,从医疗健康到家庭服务,我们将看到越来越多的智能体在世界模型的驱动下,为人类创造更大的价值。而中国,将在这场变革中扮演至关重要的角色。
(文/克林)
e-Mail:lab@enet16.com