视觉检测领先者
全国咨询热线:13812953225

二十多年来中国首次CVPR最佳学生论文授予同济阿里

发布时间:2024-01-10 07:37:19 人气: 来源:下载雷火电竞亚洲先驱
案例介绍

  全球AI领域最具影响力的大会CVPR近日宣布,将2022年“最佳学生论文”奖颁给同济大学研二学生陈涵晟等人,这是二十多年来首次有中国高校学生获此殊荣。该论文是陈涵晟在阿里达摩院实习期间的成果,能从单张图片计算出3D物体在真实世界里的位置和朝向,有望成为无人驾驶、机器人等技术发展的理论动力。他说,因自己是硕士生,压力小,所以能按个人兴趣去做研究,没想过要做出重大成果。

  CVPR(国际计算机视觉与模式识别会议)是AI领域的顶级学术会议,今年共收到8161篇论文投稿,只评出最佳论文和最佳学生论文各1篇,他们常被视作人工智能技术的风向标。CVPR早在2001年就设立最佳学生论文奖,今年首次发给中国高校学生。获奖论文《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation 》来自同济大学汽车学院和阿里巴巴达摩院,作者分别是陈涵晟、王丕超、王帆、田炜、熊璐、李昊。

  论文研究的是3D视觉领域经典问题,通过单张图像求解3D物体在真实世界里的位姿(位置和朝向)。这一技术方向应用前景广阔,是无人驾驶、机器人等行业的基础技术。比如在无人驾驶中,只有先计算出周边车辆的位姿,判断对方究竟是要加速、刹车还是变道,己方车辆才能做出对应操作,计算不准或者过慢都可能会引发事故。

  由于该问题难度高,始终没得到有效解决。获奖论文提出的新方法EPro-PnP,创造性地引入概率分布,将几何推理和深度学习两种方法无缝衔接,形成了一个端到端的易用模型,能够迅速估算3D物体的位姿。实验证明,新模型通用性强、定位准确,不需要提前知道物体的几何形状;更重要的是高效简洁,且具有较好的可解释性,有望用于无人驾驶、机器人、无人机、AR等诸多一定要通过视觉来估算物姿的场景。

  据了解,论文第一作者陈涵晟本硕都就读于同济大学汽车学院,目前研究生二年级在读,导师为熊璐教授,副导师为田炜助理教授,达摩院导师为王丕超博士。他的研究方向是计算机视觉中的3D物姿估计,研一就已在CVPR发表论文。2021年到阿里达摩院做研究型实习生后,在达摩院日常研究讨论中碰撞出灵感,尝试去构造统一的理论框架。

  “我原来以为这篇论文可能比较冷门,因为太偏数学,没想到能够获奖。”陈涵晟说,因自己是硕士生,压力较小,所以能按兴趣去做研究,做出什么就是什么,没想过要做出重大成果。未来,他希望安静下来继续做研究。

  论文第一通讯作者、达摩院算法专家王丕超博士表示,这篇论文特别之处在于,用数学的方式解决AI底层问题,带来了基础理论上的突破,对3D视觉领域的研究和应用都将产生积极影响。

  据悉,研究型实习生是阿里巴巴在2017年创立的科研项目,已为全球200多所顶尖高校的1000多名学子提供科研岗位。