全球人工智能领域迎来重要动态:曾在美国加州大学圣地亚哥分校执教的苏昊教授正式加盟复旦大学,担任浩清特聘教授及通用物理智能研究院首任院长。这位在ImageNet数据集构建和具身智能领域作出开创性贡献的学者,凭借约15万次的论文引用量,稳居具身智能领域全球学者前列,在华人学者中更是独占鳌头。在校庆科学报告会上,他以"物理智能:从感知到交互"为主题,首次系统阐述了回国后的学术规划。
报告开场即抛出深刻问题:"当前AI系统能识别人脸、理解文字,但推倒桌上杯子时,它能预测运动轨迹吗?若施加双倍力度,结果会有何不同?"这个看似简单的场景,直指当前人工智能发展的核心困境。苏昊回顾18年海外研究历程时指出,从2D图像识别到3D空间建模,再到开发交互式物理仿真平台,所有探索都指向同一个结论:实现通用人工智能必须将"感知"与"行动"整合在统一框架中。正是基于这种认知,他与国际顶尖团队共同推动了具身智能的学科定义与发展。
研究团队通过大量实验发现,机器人操作物体的能力存在双重瓶颈:简单操作受限于视觉感知精度,复杂操作则卡在物理规律理解层面。苏昊以搬运纸箱为例解释物理理解:"人类伸手前就能判断重量和结构,这种能力来自无数次物理交互的积累,而非书本知识。"他构建的智能层级理论显示,当前AI仅突破前两层(感知智能、空间智能),而真正具备物理交互能力的生物,在自然界中仅存在于鸦科鸟类和类人猿等少数物种。
针对现有世界模型的局限,苏昊提出突破性观点:几何模型擅长空间解析,视频模型精于视觉生成,但两者都缺乏物理规律理解能力。"我们需要第三种模型——物理交互世界模型,它能同时处理空间关系和物理因果。"这种模型目前尚处萌芽阶段,但苏昊认为这正是定义下一代AI范式的关键机遇。他领衔的通用物理智能研究院将聚焦两大方向:构建能预测物理后果的交互模型,以及培养具有跨学科视野的AI人才。
在人才培养方面,苏昊强调"问题导向"而非"论文导向":"我们要寻找能提出关键问题、保持长期探索耐心的研究者,真正的成果应该体现在真实世界的智能应用上。"为此,研究院确立了"交叉、交互、验证"三大原则:打破学科壁垒组建研究团队,通过仿真平台和真实场景双轨采集交互数据,坚持在现实环境中检验模型有效性。这种研究哲学与复旦"博学而笃志,切问而近思"的校训形成深度共鸣。
对于中国在物理智能领域的机遇,苏昊保持审慎乐观。他指出,虽然在大语言模型领域中国是追赶者,但在物理智能这个新赛道上,全球研究者仍处于同一起跑线。"上海完善的产业生态和复旦的数理基础,为物理智能研究提供了理想土壤。"他同时提醒,当前展示的机器人操作演示与真正通用能力之间仍存在关键差距,实现深度物理理解需要长期积累,但人机共存时代的到来已不可逆转。
"没有理解就没有泛化,没有交互就没有理解。"这句总结凝聚了苏昊团队的核心认知。他们正在建设的物理仿真平台,已能模拟不同材质物体的交互效果,为训练具备物理常识的AI系统提供基础数据。这种从"看世界"到"理解世界"的转变,或许正在开启人工智能发展的新纪元。


