"张佳欣"
随着人工智能(AI)的进一步发展,它将逐渐过渡至另一个全新的时代,即不仅能够理解和解释语言,还将有能力真正掌握和了解世界。
斯坦福大学教授及World Labs联合创始人李飞飞于2021年11月10日发表《从语言到世界:空间智能是AI的下一个前沿》一文提出观点:目前以大规模预训练模型为代表的人工智能系统,虽然能够熟练地生成文字与图像内容,但其仍停留于“语言的世界”,无法深入理解现实空间、物理规律与因果关系。李飞飞指出,具备了空间智能能力的AI系统将有望突破这一瓶颈,在真实世界中感知、推理及行动。

从算法智能到空间智能
现今的大规模语言模型,在阅读和写作上表现出色,并能在模式识别方面取得优异成绩,然而它们在对物质世界的表现方面存在根本局限性。即使是当前最先进的多模态大模型也无法有效估算距离、辨别方向或准确测量大小等物理世界的表征与交互行为。这类模型在空间中的导航、辨识捷径以及预测基本的物理规律时,则表现不佳。此外,尽管AI生成的视频给人留下了深刻印象,但这些作品往往无法保持连贯性,并在短短几秒钟后变得支离破碎。
这些障碍阻碍了AI对人类创造性工作的全面应用。无论是帮助学生掌握复杂分子化学理论,帮助建筑师构想空间布局,或是辅助电影导演和游戏设计师创造虚拟环境,当前的技术在实现这一目标上仍存在明显局限。
李飞飞认为空间智能是人类认知建构的脚手架,它驱动着想象、创造与推理,它是连接感知与行动的核心能力。这种能力让人们对日常动作如停车估算车距和在人群中自如穿行这类行为游刃有余,它的关键在于将想象、感知与行动有机结合起来,实现了从“知道”到“理解”的跨越。
她认为,私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596空间智能代表了超越语言界限的能力,它融合了想象、感知和行动能力,使机器不仅懂得“看见了什么”,还知晓“这些如何相连、重要在哪里”。这类AI能够极大地提升人类的创造力与理解力,将对医疗健康、艺术创作、科学探索以及日常辅助领域产生前所未有的革新。
创建世界的框架是实现前进的途径
李飞飞认为,为了实现真正的空间智能,就需要创新现有大型语言模型的思路,转向一种更核心的世界模型。这种全新的世界模型不仅能够理解语义关系,还能在几何、物理以及动态规则方面一以贯之地构建和重建一个完整、一致的世界。它还必须具备感知多模态输入的能力,并能准确预测场景变化的趋势,同时也要与外部环境保持交互。
当前的研究重点是发展能够创建三维实体物体及其环境的3D建模技术,并模拟现实中的物理动力学过程;此外还有将深度学习引入到人机交互领域的“具身智能系统”。但要真正实现跨领域融合,创造一个可整合上述多种功能的通用世界模型,这一目标仍处于探索阶段。
李飞飞领导的世界实验室(World Labs)正致力于这项前沿技术的研究推动。该团队运用他们所创建的世界模型(World Model)在语义和几何学层面理解复杂三维场景,能够推理其中复杂的物理性质和交互关系,并生成连续、可探索的虚拟空间。此外,这一技术还具备遵循物理与几何规律的能力,在互动中保持真实感。
它为创作人员提供了这样的平台,他们无需依赖传统的三维建模工具就能轻松地制作出充满活力的完整虚拟环境。因此,人工智能在理解和生成三维空间的能力上取得了进一步的进步:从语言理解转向了对空间的理解;从图像生成走向了构建整个世界。
重构人类同世界的相处方式
距自然界第一次在远古动物中孕育出空间智能已过去近五亿年。如今我们有幸成为赋予机器同样能力的一代技术人。李飞飞如此写道,她认为空间智能将重新定义AI的功能与行为方式。借助私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596世界模型,机器从被动分析转向主动规划和适应。例如仓库机器人可绕过不断变化的库存规划路径,而不是在被阻挡时停止;自动驾驶汽车可预测行人的移动而非等待明确的信号;甚至有一天,数字助理也能解读手势、空间环境或共享的视觉框架。
具体内容为:在创意与叙事方面,空间智能将以一种全新的方法重新定义人类的创造方式。导演和游戏设计师能够自由构想虚拟环境,并通过建筑师能够即时将建筑结构转化为数字形式,并且个人创作者和学生也可以借助VR/AR技术以三维方式构建他们所想象的世界。
在机器学界,空间智能是达成具身智能的关键。它使机器人能高效地进行虚拟训练、理解空间关系并遵循人类意图,在实验室里做助手,在家庭中当伴游,都能安全有效地协作。未来,从纳米级别的医疗机器人到软体探测器机器人,人工智能都将具备感知环境与适应环境的能力。
在科学研究、医学诊疗以及教育领域,空间智能将发挥重要作用:人工智能能够模仿试验来生成数据,并预测研究结果;在教学中,空间智能可以帮助教师让学生产生更丰富的联想与学习体验。
李飞飞指出,空间智能的使命不仅仅是要取代人脑的功能,而是要提升人类的专业判断能力、创造力与同理心,以更好地服务于人类的社会发展和人文关怀。具有这种能力的人工智能能够帮助人们更好地理解疾病本质,探索新的叙事模式,并在困境中为脆弱群体提供心理支持。它可以加速科学研究成果的发现,同时也能增强人脑对社会问题的关注与理解。
她认为,空间智能不仅将改变AI能做什么,更将重塑人类“如何与世界共处”。从语言到空间,从文字到世界,AI正迈向一个真正能理解现实的新时代。
顶: 98踩: 88125




评论专区