具身智能奠基人苏昊入职复旦首讲：AI迈向人机共存需突破物理智能-科技业界-发现者网

全球人工智能领域迎来重要动态：曾在美国加州大学圣地亚哥分校执教的苏昊教授正式加盟复旦大学，担任浩清特聘教授及通用物理智能研究院首任院长。这位在ImageNet数据集构建和具身智能领域作出开创性贡献的学者，凭借约15万次的论文引用量，稳居具身智能领域全球学者前列，在华人学者中更是独占鳌头。在校庆科学报告会上，他以"物理智能：从感知到交互"为主题，首次系统阐述了回国后的学术规划。

报告开场即抛出深刻问题："当前AI系统能识别人脸、理解文字，但推倒桌上杯子时，它能预测运动轨迹吗？若施加双倍力度，结果会有何不同？"这个看似简单的场景，直指当前人工智能发展的核心困境。苏昊回顾18年海外研究历程时指出，从2D图像识别到3D空间建模，再到开发交互式物理仿真平台，所有探索都指向同一个结论：实现通用人工智能必须将"感知"与"行动"整合在统一框架中。正是基于这种认知，他与国际顶尖团队共同推动了具身智能的学科定义与发展。

研究团队通过大量实验发现，机器人操作物体的能力存在双重瓶颈：简单操作受限于视觉感知精度，复杂操作则卡在物理规律理解层面。苏昊以搬运纸箱为例解释物理理解："人类伸手前就能判断重量和结构，这种能力来自无数次物理交互的积累，而非书本知识。"他构建的智能层级理论显示，当前AI仅突破前两层（感知智能、空间智能），而真正具备物理交互能力的生物，在自然界中仅存在于鸦科鸟类和类人猿等少数物种。

针对现有世界模型的局限，苏昊提出突破性观点：几何模型擅长空间解析，视频模型精于视觉生成，但两者都缺乏物理规律理解能力。"我们需要第三种模型——物理交互世界模型，它能同时处理空间关系和物理因果。"这种模型目前尚处萌芽阶段，但苏昊认为这正是定义下一代AI范式的关键机遇。他领衔的通用物理智能研究院将聚焦两大方向：构建能预测物理后果的交互模型，以及培养具有跨学科视野的AI人才。

在人才培养方面，苏昊强调"问题导向"而非"论文导向"："我们要寻找能提出关键问题、保持长期探索耐心的研究者，真正的成果应该体现在真实世界的智能应用上。"为此，研究院确立了"交叉、交互、验证"三大原则：打破学科壁垒组建研究团队，通过仿真平台和真实场景双轨采集交互数据，坚持在现实环境中检验模型有效性。这种研究哲学与复旦"博学而笃志，切问而近思"的校训形成深度共鸣。

对于中国在物理智能领域的机遇，苏昊保持审慎乐观。他指出，虽然在大语言模型领域中国是追赶者，但在物理智能这个新赛道上，全球研究者仍处于同一起跑线。"上海完善的产业生态和复旦的数理基础，为物理智能研究提供了理想土壤。"他同时提醒，当前展示的机器人操作演示与真正通用能力之间仍存在关键差距，实现深度物理理解需要长期积累，但人机共存时代的到来已不可逆转。

"没有理解就没有泛化，没有交互就没有理解。"这句总结凝聚了苏昊团队的核心认知。他们正在建设的物理仿真平台，已能模拟不同材质物体的交互效果，为训练具备物理常识的AI系统提供基础数据。这种从"看世界"到"理解世界"的转变，或许正在开启人工智能发展的新纪元。