论文题目:VSPW: A large-scale dataset for video scene parsing in the wild
作者列表:苗嘉旭(浙江大学),魏云超(北京交通大学),武宇(百度研究院),梁琛(浙江大学),李光睿(悉尼科技大学),杨易(浙江大学)
论文摘要:
语义分割是计算机视觉领域的一个基本任务,在自动驾驶、图片或视频编辑等多个领域应用广泛。近年来,图像语义分割方法已经有了长足的发展。然而,在现实世界应用中,数据的形式一般是视频而不是静态图片。而目前对视频语义分割的探索仍然比较有限,一个重要原因是缺少足够规模的视频语义分割数据集。本文提出了首个多场景大规模视频语义分割数据集,VSPW。VSPW是第一个多场景大规模视频语义分割数据集,VSPW数据集有着以下特点:1. 大规模、多场景标注。本数据集共标注3,536个视频,251, 632帧语义分割图片,涵盖了124个语义类别,标注数量远超之前的视频语义分割数据集。与之前数据集仅关注街道场景不同,本数据集覆盖超过200种视频场景,极大丰富了数据集的多样性。2. 密集标注。之前数据集对视频数据标注很稀疏,比如CamVid按照1 f/s的帧率标注视频。VSPW数据集按照15f/s的帧率对视频片段标注,提供了更密集的标注数据。3. 高清视频标注。本数据集中,超过96%的视频数据分辨率在720P至4K之间。
论文信息:
[1] Jiaxu Miao, Yunchao Wei, Yu Wu, Chen Liang, Guangrui Li, Yi Yang. VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021.
论文链接:
[https://openaccess.thecvf.com/content/CVPR2021/papers/Miao_VSPW_A_Large-scale_Dataset_for_Video_Scene_Parsing_in_the_CVPR_2021_paper.pdf]
代码链接:
[https://www.vspwdataset.com/]
视频讲者简介:
苗嘉旭,浙江大学博士后。在 CVPR/ICCV/IEEE TNNLS等国际高水平会议或期刊发表多篇论文,博士期间主要研究方向是行人再识别和视频分割。