• 首页
  • 学院概况
    学院简介 现任领导 组织机构 历史沿革 学科概况
  • 师资队伍
    教师简介 导师队伍
  • 人才培养
    本科生教育 研究生教育 基层教学组织
  • 科学研究
    学术交流 科研平台
  • 党群工作
    基层党组织 理论武装 党群动态
  • 学生工作
    团学组织 学生活动 青春榜样 就业信息
  • 校友工作
    工作动态 毕业合照
学术科研
  • 学术通知
  • 学术动态
学术通知
首页 > 学术科研 > 学术通知

【学术报告】信号即物理:面向多模态世界理解的结构化推理

日期:2026-05-07 责任编辑:刘佰龙 浏览量:
地点: 计算机楼A501 报告人: 王艺炜
日期: 2026年5月12日10:45

报告题目:信号即物理:面向多模态世界理解的结构化推理

报告人:王艺炜

报告时间:2026年5月12日10:45-11:30

报告地点:计算机楼A501

摘要:多模态AI在识别与生成任务上已取得显著进展,但在物理约束推理上存在系统性缺陷:音频模型无法感知声源运动方向,视频模型丢失帧间因果顺序,推理链越长反而越偏离物理真实。这些失败源于同一问题:模型将信号视为统计模式,而非物理过程的编码。为了解决这些问题,我们提出一套统一研究框架,核心主张为:Signal is Physics(每种信号模态都是物理世界的结构化投影)、结构化推理(推理的每一步应对应明确的物理操作)、以及多源一致性(对同一物理事件的多次独立观测必须相互自洽)。报告涵盖空间推理、时序推理与跨模态一致性校验等方向,展示从多模态理解到具身决策的完整研究路线图。

报告人简介:王艺炜博士现任加州大学默塞德分校计算机科学系助理教授。他于2017年获得东南大学信息工程学士学位,2019年获得香港科技大学电子与计算机工程研究型硕士(M.Phil.)学位,并于2023年获得新加坡国立大学计算机科学博士学位。他的研究方向主要包括信号处理、自然语言处理以及多模态大语言模型。他已在CCF-A类国际会议和期刊上发表论文50余篇。目前,他担任《IEEE Transactions on Industrial Informatics》、《Pattern Recognition》以及《Neurocomputing》等学术期刊的副编辑(Associate Editor)。他长期担任多个国际学术会议的组织工作,包括担任ACL和EMNLP的高级领域主席(Senior Area Chair),以及ICML、ICLR、AAAI、NeurIPS、CVPR和ICCV的领域主席(Area Chair)。他曾荣获美国国家科学基金会(NSF)CRII基金和英伟达学术基金(NVIDIA Academic Grant)。

下一篇:【学术报告】细粒度图像质量评价:细微之处见真章
大学计算机
基础课程预约
专业认证资料
管理系统
全国计算机等级
考试报名
基础试验网
专业资源网
会议室、实验室
使用预约
报修预约
下载专区

邮编:221116 联系电话:0516-83591709

地址:江苏省徐州市大学路1号中国矿业大学南湖校区

版权所有:中国矿业大学计算机科学与技术学院/人工智能学院

官方微博
微信公众号