【学术报告】多模态内容理解与生成

日期：2025-11-17 责任编辑：刘佰龙浏览量：

报告题目：多模态内容理解与生成

报告人：李泽超

报告时间：2025年11月18日16:30-17:10

报告地点：计算机楼A501

摘要：图像视频大数据智能分析与理解在多种实际应用中具有至关重要的作用，比如无人驾驶、网络空间内容安全以及社会公共安全等。同时，多媒体内容生成与理解相辅相成。为此，本报告将简要介绍团队在多媒体内容理解与生成方面的研究工作，主要包括图像理解、语义分割、视觉定位、可控文生图的增强-控制-蒸馏模型、反演适配器、风格迁移模型等，最后简单介绍下相关应用。

报告人简介：李泽超，南京理工大学计算机科学与工程学院/人工智能学院/软件学院教授、院长。研究兴趣主要是多模态智能分析、计算机视觉等。主持国家杰出青年科学基金、新一代人工智能国家科技重大专项课题、国家自然科学基金联合基金重点项目等；入选国家“万人计划”青年拔尖人才，发表CCF A类期刊和会议论文80余篇；获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项等；获得ACM MM Asia 2020和2024两年度最佳论文奖等；担任IEEE TPAMI、TNNLS、TCSVT、TMM等期刊编委。

上一篇：【学术报告】仓颉编程语言的设计和实现下一篇：【学术报告】开放环境下的视觉导航与重整理

地点：	计算机楼A501	报告人：	李泽超
日期：	2025年11月18日16:30