报告题目:开放环境下的视觉导航与重整理
报告人:蒋树强
报告时间:2025年11月18日15:50-16:30
报告地点:计算机楼A501
摘要:具身智能是真实物理世界中人工智能的重要表现形态,具身导航与重整理是指智能体根据任务目标,感知与理解周围环境并执行交互动作完成指定任务,这是具身智能系统与真实世界交互的关键技术。真实具身场景面临着诸多挑战,包括场景结构和语义的未知性带来的开放场景问题,目标种类和功能属性未知所构成的开放目标问题,以及物体位置和状态随时间演化所导致的动态变化问题。这些因素要求智能体具备更强的环境适应能力、任务泛化能力以及对环境变化的鲁棒应对能力。本报告将首先介绍具身智能、具身记忆、具身导航与重整理的研究背景,重点分享基于场景记忆、功能推理与自适应学习的最新进展,具体包括差异感知驱动的场景重整理、功能推理的开放目标导航以及具备实时适应能力的元学习方法,最后介绍具身导航从虚拟到真实环境的适配并给出演示。

报告人简介:蒋树强,中国科学院大学特聘教授,中国科学院计算所客座研究员,博士生导师,先后担任期刊《IEEE TMM》、《ACM ToMM》、《IEEE Multimedia》、《计算机研究与发展》、《JCST》、《CAD学报》编委,中国人工智能学会具身智能专委会主任,中国计算机学会多媒体专委会副主任、中国自动化学会网络计算专委会副主任、ACM SIGMM中国分会副主席。主要研究方向是多媒体内容分析、多模态具身智能技术和食品计算。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金青年基金A类(杰青)、B类(优青)、重点等项目20余项,发表论文200余篇,获授权专利20余项,多项技术应用到实际系统中,先后获省部级或学会奖励5项。