近日,国家自然科学基金青年学生项目(本科生)评审工作顺利完成,上海交通大学电子信息与电气工程学院自动化系本科生吴雄斌申报的“面向泛化性和准确性增强的自监督深度估计研究”成功获得了国家自然科学基金委员会的资助批准,该项目的指导老师是自动化系刘伟副教授。
项目介绍
深度估计是指在给定单个或多个输入图像的情况下,以逐像素的形式预测相机到场景中物体的距离。在计算机视觉领域中,深度估计可以为许多应用提供三维场景的基础信息, 在同步定位和地图绘制、三维场景重建、虚拟现实、自动驾驶等任务中有着重要应用。
该项目研究了增强自监督深度估计模型的泛化性和准确性的方法。首先,项目通过设计基于分割排列的数据增广方法对输入数据进行场景增广,消除模型在进行深度估计时对垂直位置的过度依赖,提高模型的跨场景泛化能力。在此基础上,项目从网络结构角度出发,设计分阶段增强解码器的网络结构,利用其中的全局特征校准模块校准模型注意力在空间范围内的重构,再利用细节关注模块,利用隐式方法逐像素、细粒度地设置关注度,提升模型的局部建模能力。最后,项目还将结合单尺度损失函数和多尺度损失函数各自的优点,引入自蒸馏的策略,设计单尺度自蒸馏损失函数,预期既能够提高模型的局部建模能力,又能够利用自蒸馏策略提高模型对全局结构信息的建模准确性,并最终提高模型的准确性。
项目预期通过以上三个方面的研究,增强模型的泛化性和准确性,研究出泛化能力强、准确性高的自监督深度估计算法。
项目的整体技术路线
申请人及科研平台介绍
项目申请人 吴雄斌
项目导师刘伟
申请人吴雄斌为上海交通大学电子信息与电气工程学院IEEE试点班自动化方向二年级本科生,其指导教师为刘伟副教授,二人均来自电院自动化系图像处理与模式识别研究所。
图像处理与模式识别研究所是国内最早从事模式识别领域研究的专业研究所之一,其承担建设的“模式识别与智能系统”曾在1987和2001年两度被评为国家重点学科,为“控制科学与工程”一级国家重点学科的建设提供了重要支撑。该研究所承担自然科学基金重点项目、上海市重大项目等60多项,曾获得国家科技进步一等奖等成果奖。
国家自然科学基金青年学生项目(本科生)介绍
2023年起,国家自然科学基金委开展青年学生项目(本科生),支持优秀本科生在国家自然科学基金资助范围内自主选题,开展基础学科研究工作,着力培养优秀本科生。国家基金委采用“推荐+评审”制,依托单位推荐本科生,由基金委评审择优遴选。