首页 产品 商务 新闻 案例 聚焦 企业 技术 人物 人才 下载 学术 展会 媒体 杂志 高手 V空间 小组 博客 论坛
您所在的位置:中国视觉网 >> 技术 >> 硬件 >> [组图]基于统一特征模型的体育视频镜头转换检测  
基于统一特征模型的体育视频镜头转换检测
作者韩 博,胡… 文章来源控制工程 点击数:   更新时间:2008-7-3

作者 :韩 博,胡一川,吴伟国,王贵锦,Takayuki Yoshigahara

因为在SVM的训练中为两类样本(镜头转换与非镜头转换)设定了相同的C-SVC代价参数,所以理论上算法所得到的查准率和查全率应当相同。但实际结果显示准确率普遍高于对应的查全率,其主要原因有以下两点:1)若

检测到的2个切变间距小于0.2 s,距离SVM分类界面较近的切变将会被剔除;2)如果检测到的2个渐变相互交叠,那么它们将被合并为1个。这样,误检的数目大大减少,使得查准率高于查全率。

       本文算法在全部测试序列上都能达到较高的查准率和查全率,因此,完全可以应用于自动体育视频分析。同时,本文算法的计算复杂度也是实际应用可接受的。对于MPEG-4编码的分辨率为704×480的测试序列,本文算法在P4-1.7 GHz CPU,512 MB RAM,MS Visual Studio开发环境下,处理速度约为25~30f/s。

       5 小结

       为解决已有算法在体育视频镜头转换检测中遇到的主要问题,本文提出了两种新型的中层特征,可较好地反映了体育视频中的目标级特性。并且,本文用一个以SVM作为分类器的统一特征模型集成了这些新型特征与RCH特征。可信MV特征的定义是普适的,虽然不同体育类型的场地特性不同,但是本文提出的基于统计自适应的DC特征提取方案具有很强的可扩展性;因此,该模型适用于多种体育视频(如棒球,网球和篮球)的自动分析。在较大的足球视频数据集上的实验结果表明本文算法的性能超过了现有通用算法,基本达到了自动视频分析应用的要求。
 通过分析MV这一有效的底层特征,同样可提取出中层特征来反映目标级的特性。在本文中,这种中层特征主要用来反映体育视频中的纹理和运动信息。

       视频压缩过程中计算得到的MV并不能代表所对应图像块的真正运动信息,在体育视频中尤其如此。例如,快速变化的图像内容、大面积弱纹理区域以及由于摄像机运动引起的画面模糊都有可能导致MV杂乱且不可信。因此,为了消除这些不可信MV的影响,提出了一种MV过滤的方法。此方法判断一个MV有效的准则是它所对应的块匹配残差小且块匹配残差随它的改变而较快地增大。图3给出了这种算法得到的一些实验结果,其中非可信MV的块被白色覆盖。

 

       基于这种MV可信度分析算法,本文定义3个特征:FMV1,FMV2和FMV3,它们分别表示可信MV的比例、集中程度和平均值。其中FMV1在镜头切变时比在镜头内部小很多;而FMV2和FMV3可以鉴别镜头渐变(如溶解和动画划变)过程中的一些特性。

       3 统一的特征模型

       文献[1]在使用全局阈值情况下提出对主颜色比例较大的两帧进行比较时应降低直方图距离的阈值,从而提高了其算法在体育视频镜头转换检测中的表现。笔者结合了这种想法,形成了一个将RCH特征与上述中层特征集成在一起的统一特征模型如图4所示。最后,采用训练得到的支持向量机(Support Vector Machine,SVM)分类器完成对切变和渐变的检测。

 

       3.1 切变检测方案

       本文特征模型首先判断进行比较的两帧图像是否满足条件CDC(t,s):(FDC1(t)>0)∧(FDC1(t-s)>0),s表示两帧图像间的采样间隔。

       如果条件满足,则两帧很可能非常相似。因此本文模型中分别训练两个SVM分类器进行分类(如图4)。对于隔行扫描的电视广播视频,切变可能包含一个混合帧,为检测切变,考察s为2的情况。当且仅当CDC(t,2)为真时,才可将这两帧图像的FDC2差和FDC3差作为2个DC特征输入图4中的SVMAY。

       为检测切变,模型中同时采用DRCH(t,2)和min{FMV1(t),FMV1(t-1))。为了自适应地确定它们相应的阈值(特征空间中的分类界面),邻近帧的特征也作为分类器的输入。一个邻域特征表示左、右邻域的DRCH平均值中较大者,另一个邻域特征表示左、右邻域的FMV1平均值中较小者。为了防止过训练现象的发生,本文的模型没有使用文献[7]中多而细致的邻域特征。

       3.2 渐变检测方案

       与切变检测相似,2个DC特征当且仅当CDC(t,s)为真时被使用。如图4所示,本文的特征模型对于渐变检测同样分别训练两个不同的SVM分类器。本文还采用3个基于MV的渐变检测特征,分别代表平均的可信MV比例,平均的可信MV集中度以及平均的可信MV大小。

       渐变检测中还利用DRCH值在时间轴上构成的波形。例如,长度为s的渐变检测可以通过在宽度为2s+1的滑动时间窗口中搜索符合特定规律的DRCH(t,s)波形来实现。为了完整地描述不同渐变过程所对应的DRCH波形,本文提取了5个特征,包括峰、谷的值和位置,以及峰谷间变化的单调性等。假设要确定第(t-s)帧至第t帧是否是一个渐变,这5个特征将从序列{DRCH(t-s,s),…,DRCH(t+s,s)}中提取。在实际计算中,一般只使用几个步长作为渐变长度s的可能值,例如当帧率是29.97时使用步长12,18,24,30,36。

       4 实验结果

       实验在由12个视频序列组成的数据集上进行,每个视频序列对应半场足球比赛。前6个序列用于SVM训练,后6个序列用于测试本文的算法。所有视频序列的分辨率均为704×480,帧率均为29.97 f/s(帧/秒)。这些视频拍摄于不同的球场并由不同的电视台编辑制作,因此足以用来测试本文的算法。

       表1展示了算法在测试集上的结果。为了证明中层特征的有效性,实验中还训练了2个仅使用RCH特征的SVM分别检测切变和渐变,并将其结果列于表1中进行对比。从整体结果来看,本文提出的中层特征明显提高了镜头转换检测算法的性能。同时可以发现,算法在渐变检测上的提升更为明显:在查准率仅下降约6%的情况下,查全率提高了近20%。对于切变检测,因为仅使用RCH特征的结果已经非常好(如测试集中的4,5,6序列),很难再通过中层特征的使用进一步提高性能。

 

因为在SVM的训练中为两类样本(镜头转换与非镜头转换)设定了相同的C-SVC代价参数,所以理论上算法所得到的查准率和查全率应当相同。但实际结果显示准确率普遍高于对应的查全率,其主要原因有以下两点:1)若

检测到的2个切变间距小于0.2 s,距离SVM分类界面较近的切变将会被剔除;2)如果检测到的2个渐变相互交叠,那么它们将被合并为1个。这样,误检的数目大大减少,使得查准率高于查全率。

       本文算法在全部测试序列上都能达到较高的查准率和查全率,因此,完全可以应用于自动体育视频分析。同时,本文算法的计算复杂度也是实际应用可接受的。对于MPEG-4编码的分辨率为704×480的测试序列,本文算法在P4-1.7 GHz CPU,512 MB RAM,MS Visual Studio开发环境下,处理速度约为25~30f/s。

       5 小结

       为解决已有算法在体育视频镜头转换检测中遇到的主要问题,本文提出了两种新型的中层特征,可较好地反映了体育视频中的目标级特性。并且,本文用一个以SVM作为分类器的统一特征模型集成了这些新型特征与RCH特征。可信MV特征的定义是普适的,虽然不同体育类型的场地特性不同,但是本文提出的基于统计自适应的DC特征提取方案具有很强的可扩展性;因此,该模型适用于多种体育视频(如棒球,网球和篮球)的自动分析。在较大的足球视频数据集上的实验结果表明本文算法的性能超过了现有通用算法,基本达到了自动视频分析应用的要求。

短信联系:
技术录入:admin    责任编辑:admin             
【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
  其他文章  
 
  • 上一篇技术:

  • 下一篇技术: 没有了
  •   相关文章  
      航天嵌入式图像处理技术
    机器视觉的镜头选择创造不同
    开发视觉导引运动系统概述
    信号处理(智能视频监控系统设计要点之四)
    数码摄像机(智能视频监控系统设计要点之三
    网络视频服务器与路由器 (智能视频监控系统
    数码IP摄像头(智能视频监控系统设计要点之
    智能视频监控系统设计要
    采用视频方式的点坐标测量方法
    片内相位测量工具模拟光刻机
    点击今日
     
    最新热门
    最新推荐
    聚焦
     
     
     
    姓 名: * 游客填写  ·注册用户 ·忘记密码
    主 页:
    • 请遵守《互联网电子公告服务管理规定》及中华人民共和国其他各项有关法律法规。
    • 严禁发表危害国家安全、损害国家利益、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容的评论。
    • 用户需对自己在使用本站服务过程中的行为承担法律责任(直接或间接导致的)。
    • 本站管理员有权保留或删除评论内容。
    • 评论内容只代表网友个人观点,与本网站立场无关。
    评 分: 1分 2分 3分 4分 5分
    内 容:
     
       小组
       博客
       论坛