【VALSE论文速览-62期】VSPW: A large-scale dataset for video scene parsing in the wild

803
1
2022-04-08 18:48:34
正在缓冲...
14
4
16
1
论文题目:VSPW: A large-scale dataset for video scene parsing in the wild 作者列表:苗嘉旭(浙江大学),魏云超(北京交通大学),武宇(百度研究院),梁琛(浙江大学),李光睿(悉尼科技大学),杨易(浙江大学) 论文摘要: 语义分割是计算机视觉领域的一个基本任务,在自动驾驶、图片或视频编辑等多个领域应用广泛。近年来,图像语义分割方法已经有了长足的发展。然而,在现实世界应用中,数据的形式一般是视频而不是静态图片。而目前对视频语义分割的探索仍然比较有限,一个重要原因是缺少足够规模的视频语义分割数据集。本文提出了首个多场景大规模视频语义分割数据集,VSPW。VSPW是第一个多场景大规模视频语义分割数据集,VSPW数据集有着以下特点:1. 大规模、多场景标注。本数据集共标注3,536个视频,251, 632帧语义分割图片,涵盖了124个语义类别,标注数量远超之前的视频语义分割数据集。与之前数据集仅关注街道场景不同,本数据集覆盖超过200种视频场景,极大丰富了数据集的多样性。2. 密集标注。之前数据集对视频数据标注很稀疏,比如CamVid按照1 f/s的帧率标注视频。VSPW数据集按照15f/s的帧率对视频片段标注,提供了更密集的标注数据。3. 高清视频标注。本数据集中,超过96%的视频数据分辨率在720P至4K之间。 论文信息: [1] Jiaxu Miao, Yunchao Wei, Yu Wu, Chen Liang, Guangrui Li, Yi Yang. VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021. 论文链接: [https://openaccess.thecvf.com/content/CVPR2021/papers/Miao_VSPW_A_Large-scale_Dataset_for_Video_Scene_Parsing_in_the_CVPR_2021_paper.pdf] 代码链接: [https://www.vspwdataset.com/] 视频讲者简介: 苗嘉旭,浙江大学博士后。在 CVPR/ICCV/IEEE TNNLS等国际高水平会议或期刊发表多篇论文,博士期间主要研究方向是行人再识别和视频分割。
为计算机视觉、图像处理、模式识别与机器学习等研究领域内的华人青年学者提供深入学术交流的舞台。
客服
顶部
赛事库 课堂 2021拜年纪