图灵奖得主杨立昆指出,当前的大语言模型存在理解物理世界、持久记忆、推理能力和复杂规划等四个致命弱点,而世界模型有望克服这些弱点,通过在大规模现实世界视频中分析因果关系,让机器像人类一样理解物理规律和进行推理决策。
世界模型源于心理学对心智模型的研究,旨在让机器构建对环境的内部模拟,从而进行预测和决策。随着技术的发展,世界模型已从理论构想走向实际应用,尤其是在游戏、自动驾驶和工业场景中展现出巨大潜力。
与大语言模型不同,世界模型不依赖于文本数据,而是通过深度分析现实世界视频来推测因果关系,这使得它在理解物理世界和进行复杂决策方面具有独特优势。