万能的技术宅吧 关注:19,611贴子:44,232
  • 3回复贴,共1

实时视频动作检测(action detection)

只看楼主收藏回复

网页链接




来自Android客户端1楼2021-10-10 13:53回复
    行为检测任务可以分为时序行为检测( temporal action detection) 和时空行为检测( spatio-temporal action detection) 两类。前者只需要得到行为的类别以及在视频中发生的开始帧和结束帧,而后者还需要定位出与行为相关的目标( 人、物体等) 的空间坐标。


    来自Android客户端2楼2021-10-10 13:53
    回复
      ava数据集简介:本文介绍了一种具有时空定位(Spatio-temporally Localized)的原子视觉动作(AVA)视频数据集。这里的原子视觉动作即为谷歌推出的一个新的视频数据库,名称为“原子视觉行为(AVA)。AVA数据集在430个15分钟的视频剪辑中密集地注释了80个动作,动作在空间和时间上进行了定位,标注了1.58万个动作标签,每个人都有多个动作标签出现。


      来自Android客户端3楼2021-10-10 13:53
      回复
        slowfast论文简介:本论文提出了用于视频识别的SlowFast网络。该模型包含:1)Slow路径,以低帧率运行,用于捕捉空间语义信息;2)Fast路径,以高帧率运行,以较好的时间分辨率捕捉运动。可以通过减少Fast路径的通道容量,使其变得非常轻,同时学习有用的时间信息用于视频识别。该模型在视频动作分类和检测方面性能强大,而且SlowFast概念带来的重大改进是本论文的重要贡献。在没有任何预训练的情况下,本论文在Kinetics数据集上的准确率达到了79.0%,远远超过之前的最佳水平。在AVA动作检测数据集上,我们也达到了28.3 Map,是当前最佳水平。


        来自Android客户端4楼2021-10-10 13:53
        回复