报告题目:信号即物理:面向多模态世界理解的结构化推理
报告人:王艺炜
报告时间:2026年5月12日10:45-11:30
报告地点:计算机楼A501
摘要:多模态AI在识别与生成任务上已取得显著进展,但在物理约束推理上存在系统性缺陷:音频模型无法感知声源运动方向,视频模型丢失帧间因果顺序,推理链越长反而越偏离物理真实。这些失败源于同一问题:模型将信号视为统计模式,而非物理过程的编码。为了解决这些问题,我们提出一套统一研究框架,核心主张为:Signal is Physics(每种信号模态都是物理世界的结构化投影)、结构化推理(推理的每一步应对应明确的物理操作)、以及多源一致性(对同一物理事件的多次独立观测必须相互自洽)。报告涵盖空间推理、时序推理与跨模态一致性校验等方向,展示从多模态理解到具身决策的完整研究路线图。

报告人简介:王艺炜博士现任加州大学默塞德分校计算机科学系助理教授。他于2017年获得东南大学信息工程学士学位,2019年获得香港科技大学电子与计算机工程研究型硕士(M.Phil.)学位,并于2023年获得新加坡国立大学计算机科学博士学位。他的研究方向主要包括信号处理、自然语言处理以及多模态大语言模型。他已在CCF-A类国际会议和期刊上发表论文50余篇。目前,他担任《IEEE Transactions on Industrial Informatics》、《Pattern Recognition》以及《Neurocomputing》等学术期刊的副编辑(Associate Editor)。他长期担任多个国际学术会议的组织工作,包括担任ACL和EMNLP的高级领域主席(Senior Area Chair),以及ICML、ICLR、AAAI、NeurIPS、CVPR和ICCV的领域主席(Area Chair)。他曾荣获美国国家科学基金会(NSF)CRII基金和英伟达学术基金(NVIDIA Academic Grant)。