央广网

模糊视频秒变高清 国际计算机视觉大赛深圳联合团队包揽四冠

2019-07-02 19:38:00来源:央广网

  央广网深圳7月2日消息(记者黄倩 通讯员严偲偲)记者今日从中科院深圳先进技术研究院(以下简称深圳先进院)获悉,计算机视觉领域内最负盛名的学术会议之一——IEEE国际计算机视觉与模式识别会议(CVPR)日前在美国加州举行,会上颁发了Workshop NTIRE 2019 视频复原比赛相关奖项,由深圳先进院、香港中文大学等四家单位组成的联合团队研发的一套EDVR算法,包揽了该比赛四个赛道的全部冠军。

                                 联合团队获得Workshop NTIRE 2019 视频复原比赛冠军。(深圳先进院供图)

  此次视频复原比赛包含两个视频去模糊和两个视频超分辨率赛道。所谓视频去模糊,是将画面模糊的视频还原成清晰视频,而视频超分辨率则是将低清的小视频复原为高清的大视频。值得一提的是,这是该赛事举办以来首次以视频复原作为竞赛任务,而此前三届比赛都仅以图像复原为主题,这意味着任务的难度达到了全新高度。

  联合团队成员、深圳先进院数字所多媒体集成技术研究中心董超表示,视频复原必须解决图像对齐和时空信息融合两大问题。视频相邻帧存在一定的抖动,必须先对齐才能进行下一步处理。多帧图像对齐后,便需要将挖掘出的时空信息进行融合,EDVR算法中发明的多个模块很好地解决了这两大问题。“与图像复原相比,视频复原有大量的时空冗余信息可利用,因此,清晰度能够比单一图像复原更高,相应的难度也更大。”

 

                                                         图为各算法结果对比。(深圳先进院供图)

  开源代码引领潮流  视频算法用途广大

  此次夺冠的联合团队由深圳先进技术研究院、商汤科技、香港中文大学和南洋理工大学组成,专注于底层计算机视觉,包括图像和视频的超分辨率、去噪与增强等技术。从比赛结果来看,共有14支队伍进入最终排名,联合团队的算法在大部分数据集上精度指标均为最高。近日,团队已公布所使用的算法论文,并将代码全部开源。

  谈及视频复原算法的应用,董超表示,该算法在视频直播、高清电视、手机拍摄、视频监控等领域均潜藏巨大的需求量。以视频直播为例,“视频直播非常消耗流量,如果能把高清大视频压缩成低清小视频来传输,到客户端后再通过算法恢复成高清大视频,将节省成倍的流量。”

  不过,董超也表示,尽管最新算法达到了视频复原的效果,但距离实际产业化应用尚有一系列技术难题需要解决,而开源代码恰恰能加速这个过程,预计三五年内该领域会有大量论文涌现。

  联合团队多年攻关  深耕底层计算机视觉

  不仅在视觉复原大赛中一骑绝尘,在同期举办的图像复原大赛中,联合团队论文同样获得冠军。据介绍,利用深度学习解决图像超分辨率问题,需要用到大量的训练数据,一般情况下,至少200个以上的图像对才能保证图像的超分辨率效果。而此次比赛仅提供60个图像对作为训练数据,大大限制了超分辨率的效果。团队的论文首次分析并解决了超分辨率网络中的过拟合问题,即便使用少量的图像数据,也可以获得出色的结果。

编辑: 曹宇

模糊视频秒变高清 国际计算机视觉大赛深圳联合团队包揽四冠

计算机视觉领域内最负盛名的学术会议之一——IEEE国际计算机视觉与模式识别会议(CVPR)日前在美国加州举行,会上颁发了Workshop NTIRE 2019 视频复原比赛相关奖项,由深圳先进院、香港中文大学等四家单位组成的联合团队研发的一套EDVR算法,包揽了该比赛四个赛道的全部冠军。

关闭