Google推出YouTube-8M Segments时间定位资料集

Google扩充现有的YouTube-8M资料集,发布时间定位子资料集YouTube-8M Segments,YouTube-8M Segments拥有人工验证过的标记,还加入了时间定位,标记出视频中实体出现的时间,如此让YouTube -8M是分类资料集,同时也成为时间定位资料集。

YouTube-8M资料集是一个大型标签视频资料集,由数百万个YouTube视频组成,加入了由电脑自动产生的高品质标签,涵盖了高达3,800个视觉实体,这个资料集的特色是,其包括的数十亿个影格以及声音片段,可以储存在单一个磁盘中,而这能用单个GPU,一天内就可以完成基准模型训练,但由于资料集的规模以及多样性属性,也可以让使用者进行更深入复杂的图像与声音模型。

Google提到,虽然之前的YouTube-8M资料集为影片分类应用,提供了有用的训练资料,但是包含的只有机器产生的标签,而且也缺乏精细的时间定位资料,这在某种程度限制了资料集的应用范围。

而为了加速时间概念定位的研究,Google新发表了YouTube-8M Segments资料集,这是一个YouTube-8M的子资料集,属性为YouTube-8M中视频的5秒片段,由人工验证实体出现在片段与否。Google并非详尽地标记影片中的所有片段,而是另外创建YouTube-8M片段扩充,Google为每个随选的YouTube-8M视频,平均标上5个标签,YouTube-8M Segments资料集总共有237,000个片段,涵盖一千种类别。

也就是说YouTube-8M Segments资料集的补充,使得YouTube-8M资料集现在除了是一个大规模分类资料集,也是一个时间定位资料集。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();