• 首页
  • 学院概况
    学院简介 现任领导 组织机构 历史沿革 学科概况
  • 师资队伍
    教师简介 导师队伍
  • 人才培养
    本科生教育 研究生教育 基层教学组织
  • 科学研究
    学术交流 科研平台
  • 党群工作
    基层党组织 理论武装 党群动态
  • 学生工作
    团学组织 学生活动 青春榜样 就业信息
  • 校友工作
    工作动态 毕业合照
师生风采
    师生风采
    首页 > 师生风采 > 正文

    从矿大到清华科研实习生:一位本科生与AI“幻觉”的正面较量——记我院CCF B类论文发表者卜炜珏

    日期:2026-05-07 责任编辑:史毛宁 浏览量:

     

    卜炜珏

    个人简介

    卜炜珏,男,汉族,共青团员,中国矿业大学计算机科学与技术学院/人工智能学院2023级本科生。曾获第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛全国一等奖、ICPC国际大学生程序设计竞赛邀请赛(陕西)铜牌,并获评院级优秀学生干部。近期,其作为主要作者完成的学术论文《Conscious Gaze: Adaptive Attention Mechanisms for Hallucination Mitigation in Vision-Language Models》被多媒体领域顶级国际会议、CCF B类会议——IEEE International Conference on Multimedia and Expo 2026(ICME 2026)正式录用。

    兴趣为引,思考为核

    一名大三本科生,为何能在高水平学术舞台上崭露头角?答案藏在他对计算机科学发自内心的热爱与持续深入的独立思考中。

    大一下学期至大二上学期,卜炜珏便投身于一项多模态研究项目。在项目推进中,他敏锐地捕捉到一个值得深究的现象——视觉语言模型在实际应用中频繁出现“幻觉”:模型输出的描述与真实图像内容之间产生偏差。相比于完成既定任务带来的成就感,这个全新的科学问题更令他着迷。

    经过反复实践与验证,卜炜珏提出了“文本惯性”这一概念。他打了个生动的比方:当模型看到一张草地上野餐的照片时,由于训练数据中“野餐”与“狗”频繁共现,模型便不由自主地脱离当前视觉信息,凭空“脑补”出一只并不存在的狗。而他的研究,正是要为模型装上一个实时的“监控器”——在它“走神”的瞬间及时介入,将其拉回正确、基于图像的推理轨道。

    立足实际,创新求是

    精准把握问题后,卜炜珏明确了论文的核心思路:针对视觉语言模型生成过程中因注意力偏离图像、陷入“文本惯性”而产生幻觉的问题,提出一套无需额外训练的动态内部纠偏框架。

    与此前主要依赖外部逻辑干预或后处理过滤的方法不同,他的工作实现了一次范式转变——从“外部后处理”迈向“内部机制干预”。尤为亮眼的是,他创新性地引入博弈论中的哈桑尼交互(Harsanyi interaction)方差,将以往仅用于解释性分析的指标,转化为具有更高实时性与细粒度的动态干预重定向工具。该方法还具备“热插拔”特性,可直接部署于各类视觉语言模型的主干网络之上。

    在实际应用中,他设计了一套精巧的机制:首先通过“认知需求传感器”,基于哈桑尼方差实时监测模型注意力即将脱离视觉依据的临界点;一旦检测到异常波动超出阈值,系统便启动“聚焦共识诱导模块”,将模型的注意力强行重定向并锚定在图像视觉词元上。

    需要指出的是,AI幻觉在日常对话中或许只是带来短暂的不悦,但在医疗影像分析、自动驾驶、工业机器人等高安全性场景中,任何一次“幻觉”都可能引发难以估量的风险。卜炜珏的工作从源头纠正幻觉,兼具极高的模型可移植性,在保持原有模型流畅性与通用能力的前提下,显著抑制了幻觉的发生,为AI技术的安全落地提供了有力保障。

    锲而不舍,众志成城

    科研从来不是坦途。模型调试中,细微的参数变化就可能导致输出语言生硬失真;审稿期间,评审专家也直指工作中的若干不足。面对这些棘手难题,卜炜珏沉下心来,化身为一颗螺丝钉,耐心排查日志、分析注意力分布热图,并进一步引入“头部发散指数”进行定量刻画,最终以扎实的消融实验证明了方法的优势。谈及科研的“秘诀”,他朴素地说:“只要大方向正确,遇到bug就去拆解它,一步步总能走通。”

    人心齐,泰山移。这篇论文的背后,凝结着整个团队的心血。卜炜珏将这次成功归因于集体智慧的胜利。导师袁冠教授与师兄张桂衔在研究方向修正、机制设计优化方面倾注了大量精力,手稿历经六十余版反复打磨;学院各部门在关键的资金与资源支持上提供了坚实后盾。

    投稿过程同样波澜起伏。卜炜珏用“惊险”来形容这段历程——审稿意见涵盖了从Borderline、Weak Reject到Strong Accept、Weak Accept的全谱评价,既有对创新亮点的由衷赞赏,也有对未见模型泛化能力及大模型适配层数等方面的严格质询。这段经历让他深刻体会到:必须学会以审稿人般的严谨目光审视自身工作,方能不断精进。

    善用工具,高效平衡

    投身科研而不落下课业,卜炜珏有一套自己的方法。在他看来,善于借助AI工具至关重要。他熟练运用各类Agent工具辅助开发,在提升编码与排错效率的同时,将重复性体力劳动交由AI处理,从而将核心精力聚焦于算法逻辑的打磨与优化。这一策略使他能够在完成繁重学业任务的同时,持续推进科研工作。

    对于有意尽早接触科研的低年级学弟学妹,卜炜珏毫不吝啬地分享经验。他认为迈出第一步的勇气最为可贵,并推荐了李宏毅、李沐等老师的优质课程与书籍。针对深度学习实验中的效率问题,他建议务必掌握远程开发技能,还推荐了两款高效利器——tmux(终端复用工具)与AlphaXiv(文献管理工具)。

    心态与氛围是科研路上不可或缺的“软组织”。卜炜珏坦言,本科生从事科研,首要的是抗挫折能力,既要敢于直面未知与迷茫,更要有主动出击、寻觅资源与答案的果敢。科研之余,他是一名音乐爱好者,闲暇时常与朋友一同放声歌唱,借此舒缓压力、调整状态。

    他特别强调:“永远不要让年级束缚住自己的想象力。低年级同学更应早立志、立大志,主动寻找机会,以勇气迈出第一步,而后用坚持和试错铺就前行的道路。”

     

    通过这次科研尝试,卜炜珏真正踏入了多模态科研领域。同时,他获得了前往清华大学担任科研实习生的机会。抱着学习的心态,他参与了多项工作的跟进实验,这段经历又激发了他对具身智能的浓厚兴趣。最近,他正在构思自己未来的研究方向。

    希望在未来的科研生涯中,他能够继续坚守对世界的好奇,保持精进的精神——不仅在自己的道路上描绘出光辉灿烂的图景,也为无数矿大学子点燃一盏可供仰望的明灯!


    新闻来源:宋庭辉、卜炜珏   

    下一篇:笃学铸魂担使命,逐梦青春绽芳华——记我院2022级小米特等奖学金获得者杜雅然
    大学计算机
    基础课程预约
    专业认证资料
    管理系统
    全国计算机等级
    考试报名
    基础试验网
    专业资源网
    会议室、实验室
    使用预约
    报修预约
    下载专区

    邮编:221116 联系电话:0516-83591709

    地址:江苏省徐州市大学路1号中国矿业大学南湖校区

    版权所有:中国矿业大学计算机科学与技术学院/人工智能学院

    官方微博
    微信公众号