数字视频实验室

2024-05-06

数字视频实验室(精选8篇)

数字视频实验室 第1篇

1、电视原理实验课程的基本设置与存在的不足

电视原理是一门实践性很强的专业课, 是大部分高校电类专业的专业基础课程。电视原理课程涉及光、电、声、磁等物理学领域, 涉及人类的视觉、声觉等感知特性。在数学层面上它涉及微积分、线性代数等诸多领域, 在电子技术层面上它涉及模拟电路、数字电路、大规模集成电路、计算机硬件和软件、整机、系统设计等方方面面, 在信息处理层面上它包括从电视信号的产生到模拟信号处理、数字信号处理、信号传输、信号接收、信号记录和信号显示的全过程, 在通信技术层面上它包括编码、调制、发射、接收以及各种多媒体技术。可以说电视原理是一个多学科综合的、在电子信息领域极具代表性的系统工程课程。

目前的电视原理实验课程一般在在教学中根据学时安排选做5~8个实验。在实验中学生学会电路焊接、元件组装、仪器使用、参数测量、整机调试、故障排除、曲线绘制、数据分析、报告撰写, 培养学生理论联系实际的能力和严肃认真的科学作风。但是在旧的教学模式中, 实验教学一直处于从属的地位, 其内容多为验证性实验, 且没有形成完整的教学体系不能适应当今迅猛发展的现代电子技术的要求。

2、创新型“数字视频综合实验、实践基地”建设模式

创新型“数字视频综合实验、实践基地”的建设将立足于原有的电视原理的实验课程, 在此基础上建立包括”电视技术基本原理、图像质量评价及数字视频信号处理”三大部分内容的创新型“数字视频综合实验、实践基地”。

2.1 新的实验体系的建设

以基本能力训练为基础, 把实验内容作为实验教学改革的突破。将现代数字视频技术最新发展和研究成果适当溶入到实验内容中, 让学生了解本学科的前沿技术与发展动向, 拓宽学生的视野。结合现代数字视频技术的发展, 拓展实验内容。开展计算机处理方法 (频谱、矢量图) 基本实验内容、数字图像和视频处理处理接轨的相关实验内容的设计。

从技术的角度观察, 视频技术目前正在全面数字化。因此, 新的实验体系的建设应体现三大特点: (1) 加强专业原理实验 (信源分析、混色实验和传像原理实验) , 压缩接收机实验。 (2) 扩大系统实验 (系统结构分析、系统参数测量和质量评价) 。 (3) 增加数字化处理实验 (广播设备和数字电视机顶盒的输出信号观测、利用FPGA的教学套件及其软件开发环境来构建数字电视实验平台, 在FPGA平台上进行综合性实验, 加深学生对数字电视技术的设计细节的理解和掌握。)

2.2 新的实验类型建立

将传统的验证性实验拓展为:演示性、实践性和创新性三类实验。学科交叉是当代科学技术发展的主要特征, 也是本实验基地的主要特色之一。实验内容要给学生整体性的知识, 注重其他学科知识在实验中的应用, 注意知识的交叉融合, 提高学生综合运用所学知识的能力。因此在实验的内容的组织上必须力图创新。

演示性实验:信源分析、混色实验和传像原理实验;

实践性实验:测量基础、电子元器件参量测试和应用、基本电路构成与调试系统结构分析、系统参数测量和质量评价创新性实验:由教师指导学生实验选题, 引导学生在FPGA的教学套件上自主实现数字终端的模拟。

通过这三种类型的实验, 使学生既掌握数字视频技术的基本原理和系统参数, 掌握主要电视器件、仪器的基本原理和使用方法, 又充分应用到数学、电路、信号处理等方面的知识。同时对实验中的某些内容采用数字化动态模型的仿真教学方法, 研究深层次揭示实验内容的新方法。实现实验教学的规模化、课程化。

2.3 建立新的实验室管理机制努力为学生提供一流的实验的软件和硬件环境

该实验基地为独立的、开放的实验室, 可面向全院各专业 (电子信息技术、微电子、通信工程技术等) 各年级的学生开放。实现面对专科生、本科生以及研究生培养、以及不同学科间的教学层次和实验技术等级。配合全院各学科各专业的理论教学, 从而加深对所学知识的理解与认识, 培养学生的自主创新能力。

3、创新型“数字视频综合实验、实践基地”建设目标

最终建成的创新型“数字视频综合实验、实践基地”让学生在实验中可以巩固学生此前学过的各种基础知识和专业基础知识, 把它们有机地联系起来融会贯通;可以扩展和深化电子信息专业知识, 培养如何通过知识综合来实现系统工程的本领;可以提高科学思维、系统设计、分析计算和实验研究的能力;可以增强开拓创新、精益求精的意识, 可以领悟科学研究的正确方法和途径。对于电子信息类学生的综合素质培养是一个十分理想的选择。

摘要:电视原理实验课程是高校电类学科的一门重要的技术基础课, 目前高校电视原理实验课程教学过程中存在验证性实验过多, 实验方法单一等具体问题。本文综合现代数字视频技术的发展, 以培养学生创新能力为目标, 提出了在原有的电视原理实验课程基础上建立创新型“数字视频综合实验、实践基地”的构想。

关键词:数字视频,创新,实践基地

参考文献

[1]朱红.电子实验教学中创新能力的培养[J].实验技术与管理, 2000, 17 (6) :1-41

数字化视频播放 第2篇

课型:新授课

课时:1课时

学习者情况分析:学生学习了如何播放和录制数字化声音,能够进行简单的声音文件的编辑,但对于

有些软件的使用操作不很熟练。

教学目标:

知识与技能:

1、了解常见的数字化视频文件类型

2、学会播放不同类型的视频文件

3、能够在线欣赏数字化视频

过程与方法:

通过学生参与,感受数字化视频的特色和魅力。

情感态度与价值观:

让学生真正体验多媒体技术的发展给我们的学习、生活带来的日新月异的变化,从而激发学生学习信息技术的积极性。

通过自主学习、小组合作学习,增强学生积极探索、互助学习的意识和培养他们的探究能力。重点难点:重点是会选择适当的工具,播放各种数字化视频文件

难点是在因特网上在线播放视频

课前准备:下载必备的文件或软件

教学反思:

1、各种播放软件都提供了播放控制按钮,用于在播放过程中对视频的快进、快退、停止、暂停、伴音音

量和声道控制等,注意教学生学会使用。

2、注意,网上经常可以看到许多视频浏览广告,其中有许多不健康的网站或网络陷阱,尽量不要浏览这

类视频。

数字化视频播放(学案)

第一环节:视频播放控制

1、必学:常见视频文件的播放

(1)观察电脑中的数字化视频文件,可知其常见类型有()、()、()和()等。

(2)你使用的播放器是(),你还知道的播放器有()、()和()。(3)你在播放过程中还遇到了什么问题?()()2、拓展:

(使用超级解霸播放VCD,用快进功能选择自己喜爱的节目。)3、探究:

尝试播放DVD盘片,体验DVD格式视频的画面质量和伴音效果。第二环节:在线收看视频节目

1、必学:在线收看视频节目

(1)你选择的视频节目播放网站是();了解这些站点的途径是()

(2)你使用的播放器为(),你收看的视频内容是(),播放效果()。

2、拓展:

数字视频实验室 第3篇

国家数字音视频及多媒体产品质量监督检验中心 (Advanced Digital TV Test Center, ADTC) 于近日成立了国内首个官方权威的数字音视频接口技术实验室———ADTC-EasyHD数字音视频接口测试实验室。该实验室隶属于ADTC, ADTC是中国最具权威的音视频产品检测机构。实验室的技术指导汇集了国内外数字音视频领域的专家, ADTC接口技术标准的专家和硅谷数模半导体 (Analogix) 的技术工程师。硅谷数模半导体作为全球领先的高性能接口解决方案供应商, 在下一代数字音视频接口领域拥有多年的经验, 并且在DisplayPort技术上处于国际领先地位。

此次成立的实验室集HDMI, DisplayPort技术乃至更新一代技术的发展研究、产品标准咨询与服务、测试方法以及国内外多种产品互连互通测试、验证、技术评估为一体, 向科研组织、产品制造商以及系统集成商提供多方位技术支撑和服务。

实验室工作范畴包括:HDMI标准测试, DisplayPort标准测试, HDCP标准测试, 内容保护技术的发展与研究, 接口技术互联互通性测试和接口技术培训与咨询服务。为企业及时解决成本、时间、技术、资源等多方面的实际问题。实验室配备了大量国内外测试仪器和软件, 随着市场的变化, 实验室将随时扩充新的设备机型, 提供最具实效性的测试服务, 逐渐向综合性、规模化的多媒体设备公共服务平台发展。

数字视频压缩编码技术 第4篇

1 压缩编码技术介绍

随着计算机技术的广泛应用与快速发展, 多媒体已经进入到人们生活、工作的各个领域。视频是多媒体通信中最重要的媒体之一, 由于视频的信息量非常大, 如果没有高效率的压缩技术或者很宽的信道, 是很难传输和存储的。

图像压缩是图像存储处理和传输的基础, 最大可能地压缩数量、充分利用有限的信道带宽和存储空间, 是学者们几十年来追求的目标, 随着微电子和编码技术的迅速发展, 图像编码已应用到视频技术的每一个领域。

事实上我们所见的视频信号中有许多冗余信号, 而且人的眼脑机制要小的多, 再加上数字处理技术要比通信技术成本下降快得多, 因此对视频信号进行编码操作以获得数据压缩、减少传输量是很值得关注的一个研究方向。

视频压缩技术的关键是视频压缩编码理论, 压缩就是从时域、空域两方面去除冗余信息, 即将可推知的确定信息去掉。活动视频每幅图像都有空间冗余和心理视觉冗余, 可采用合适的帧内压缩算法去除帧内冗余。对于活动视频来说, 还存在相邻图像间存在的相似性, 因而产生帧间冗余, 可采用运动补偿的编码方法去掉帧间冗余。把以上两种压缩算法结合起来使用, 就实现了数字视频的压缩。

在视频通信应用中, 编码方法的选择不但要考虑到压缩比、信噪比, 还要考虑到算法的复杂性, 太复杂的算法可能会产生较高的压缩比, 但也会带来较大的计算开销, 软件实现时会影响通信的实时性。

数据压缩技术实现的衡量标准是:压缩比要小, 恢复后的失真小, 压缩算法要简单、速度快, 压缩能否用硬件实现。

2 图像序列的几种基本编码方法

摄像机捕获的视频是图像序列, 它传输的一个常用的方法是仅传送图像序列之间的差异而不是传输整幅图像。这种传输方法的前提是:在许多的视频应用中, 如视频会议, 视频的每一帧之间的差异不大, 因此, 还有一些电视信号中, 背景变换至少间隔有3秒。这个数据对于扫描速度25帧/秒来说, 就相当于发送完第一帧图像后, 只需要发送74次图像间的差异即可。由于每一帧间的变化不大, 因此传输差异就有效地减少了信号的传输量。

但是当图像场景发生转变时, 这个方法就出现了问题, 因为一幅新的图像的信息量在一帧接收时间内是无法传输完成的。解决这个问题的一种方法是在图像显示前传输, 即采用一个帧缓冲区的方法。每次传输一幅新的图像时, 也许需要显示3帧所用的时间, 这时候显示的是缓冲区内的3帧, 然后新的图像的传输也就完成了。

运动检测也是一个很重要的方面, 运动前后的两幅图像, 可能具有完全相同的结构, 只是图像中物体的位移发生了变化, 但是这种情况在最坏情况下, 图像需要重发。实际上, 除了运动信息外, 再没有其他信息了。

一种解决这个问题的方法称为块匹配方法。将一幅图像分解为几块, 每次与上一帧图像相邻的块进行比较, 以确定最佳匹配, 这种方法成为全搜索块匹配方法。

由以上介绍可以看出, 图像序列的表达是有冗余的, 这种冗余体表现在空间和时间上的相关性。除此之外, 还可以利用人眼生理特性, 对图像进行压缩处理, 如在人眼的低敏感区域降低图像质量, 以取得更高的压缩因子。例如在帧间编码时, 运动物体比静止物体所需要的分辨率低。

对于一个具体应用的编码, 要利用所传输图像序列的统计特性、谱特性以及人的生理心理特征, 来达到最好的压缩效果。其目的就是在传输速度、成本以及显示质量之间选择一个好的平衡点。

图像序列通常在空域和时域上相关, 在空域上的相关程度体现了一幅图像的细节表现程度, 而时域上的相关程度表现了图像内容运动量的大小。这种相关性可以通过在相应域内编码部分或完全去掉。通常, 若编码在空域内进行, 即在一帧图像内部进行, 则称为帧内编码, 若编码在空域内进行, 则成为帧间编码。在实际应用中通常结合两种编码方式, 以达到最好的编码效果。

2.1 预测编码

预测编码是利用视频信号重的冗余度来降低按一定保真度进行信号通信所需的数据传输率。由于图像序列在空间和时间上的相关性, 一个给定的样点值可以根据之前传输的样点值预测得出。预测编码最常用的方式是差分脉冲编码调制, 基本的DPCM编码器/解码器结构如图1所示。预测误差在环路中量化后被传送。

由图1可以看出, 在没有传输误差和在发射端和接收端都达到理想预测的情况下, 重建误差 (yn-xn) 是由预测误差 (rn-dn) 造成的。量化器的特性必须与预测误差dn的统计特性相匹配。如果改进预测器, 降低预测误差的方差, 则对于给定量化级数的量化误差的方差也会降低, 从而改进重建信号的质量。换言之, 如果要求的图像质量已定, 则可以使用较少的量化级数, 从而降低了所需的传输速率。预测误差信号dn的统计特性对环路重的量化器不是很敏感。

由于预测误差信号中dn的统计特性对回路中的量化器存在与否并不十分敏感, 所以, 可以先设计没有量化器的预测器 (线性系统) , 然后再根据预测误差统计特性设计出量化器。

2.2 运动补偿预测

待传送的时变图像一般都包含几个具有不同运动队的物体。如果摄像机固定, 则景物静止;在摇镜头的情况下, 景物则以几乎均匀的速度移动。在任何一种情况下, 除由于运动而新增的背景和前景外, 奇遇像元都在前一帧出现过, 它的位置取决于所属物体的运动情况。因此, 如果图像的运动已知, 就可以通过对前一帧图像上的像元位移和插值来得到当前场像元的良好预测, 这正是运动补偿预测编码的基础, 其目的是使预测建立在更接近输入信号实际模型的基础上, 以获得比固定预测器更好的改进。

其基本技术包含以下几部分:

图像位移场的估计:一个简单的方法是首先从图像中分出固定背景和具有不同但均匀位移的几个物体, 然后分别计算每个物体的位移量。

利用位移量产生运动补偿的预测 (这包括前面场或帧的插值) 。

对预测误差及附带信息 (分割和位移估计) 进行编码。

其基本框图见图2, 输入信号在进入预测回路的同时, 也被送入景物分割和位移估计模块中, 分割信息可以送入位移估计器, 使位移估计限定在一个物体或区域内。也可以让分割和位移估计模块交换信息, 递归地改进位移场地估计, 两者的信息都用于预测器的控制。

对于固定物体和背景来说, 位移为零, 最佳预测就是前一帧的数据。对运动区域来说, 预测就是插值滤波器的输出, 滤波器的参数由位移估计决定。如果假设是刚体运动, 位移可以描述为一个平移和围绕物体上任意一点的旋转。因此, 每一个物体必须传送三个附带参数。当区域很大时, 这些参数的开销很小。在经常假定只有平移的情况下, 只需传送两个参数。当分割模块识别出新区域时, 可以用帧内预测来处理这些区域。

这个原则是非常一般的, 但是在实际操作中很难把图像分成不同的运动物体, 特别是实时实现的。已经出现了几种避免图像分割的简单方法。一种将图像分割成规则的方块, 假设每块包含一个在固定背景下运动的物体, 然后只需要将每个方块分成变化和不变化区域, 并对变化区域进行位移估计。另一种方法在给定前一像元的估计后, 递归地估计当前像元的位移, 这种方法不需要传送位移信息。

2.3 混合编码

将几种图像序列的压缩技术结合起来, 就构成了混合编码方法。

图3给出了一个运动补偿的混DPCM/DCT帧间编码器。该技术很有效, 可将视频会议类型的信号压缩到64kb/s。

图3不同的延迟是运动补偿所需要的。当运动被检测出来后, 当前块内的像元与运动补偿后的块内像元之差被变换编码。由于进入编码器的像元差本质上较小, 变换系数的熵就较低, 而且编码器输出的直流系数, 也就是像元差的平均值, 同样较小。

图3中的量化器实际上包括一组量化器, 每个量化器对应一个系数。在自适应编码中, 对DCT系数既可以用多个不同的量化器, 也可采用Z字型扫描方式只对前N个最大系数进行量化, 而令其余系数为零。

从缓存到编码器的反馈控制保证了数据生成速率不会超过信道允许速率。当缓存溢出时, 可以用与有条件再补偿 (CR) 方法相似的方式, 改变运动检测器的门限和量化器特征。

2.4 变换编码

一维和二维变换编码技术已用于减少视频信号和图像中的空间冗余度。为了消除时间上的冗余度, 可使用三维变换编码技术。图4给出了三维变换编码系统的基本原理。

图像序列被分为三维块, 每块尺寸为N1×N2×N3个像元。对每块进行酉变换, 则输入块 (矩阵) g (i1, i2, i3) 和变换后的输出矩阵G (k1, k2, k3) 有以下关系:

k1=0, N1-1;k2=0, N2-1;k3=0, N3-1

式中, A(k1, i1, k2, i2, k3, i3)是酉变换的核。

变换的结果使块内大部分能量可压缩成少数几个变换系数, 经变换后在信道内传送。在接受端, 系数被解码, 逆变换过程完成图像块到时空域的恢复, 即:

式中, (k1, k2, k3) 是量化后 (编码后) 的变换系数, ( i1, i2, i3)是恢复后的像元灰度。

由于在信道中要传输变换系数, 因此还需要对变换系数进行编码。变换系数编码的第一步是带状采样, 为量化和传输预选一些变换系数, 剩下的系数不需要传输。接收端将这些不传送的系数置为0或根据传送的系数得到某些估计值。带状采样有几种准则, 理想的方法是采用主管标准, 即根据试验结果得到的主管评价来选择需要传送的变换系数。然而, 由于有太多的可能情况, 这种方法是不实用的。目前通用的方法是考虑变换系数的能量, 即保留能量较大的系数, 去掉能量较小的系数。这一过程类似于对静止图像的压缩, 可以用多种方法实现。笔者认为, 使用小波理论能够得到很好的结果, 即选择阈值, 去掉经过小波变换后系数小的细节。系数选定后, 依据变换系数的能量决定量化所用的比特数。

对每个变换系数, 均可使用之前介绍的方法设计出最小均方量化器, 这通常需要知道每个系数的概论密度函数或合理的模型。

实际上, 还可以通过合并重要变换系数的方法获得较大的增益。

3 结束语

在网络视频技术飞速发展的今天, 视频压缩编码技术的发展将以支持可伸缩的方式为主要方向。基于分层模式, 在提供更高压缩比的情况下, 提供更高的误码弹性, 以适应各种通信网络的要求。

摘要:基于网络的视频监控系统主要包括网络视频监控系统中的计算机数字视频处理技术、视频压缩编码技术、信号传输技术以及多媒体信息建立技术等, 其中压缩编码技术是网络视频监控系统中的关键技术。介绍了针对数字压缩编码的几种图像序列基本编码方法和应用。

关键词:数字视频,压缩编码,图像序列

参考文献

[1]精英科技.视频压缩与音频编码技术[M].北京:中国电力出版社.2001.

[2]DOUGLAS E.COMER、DAVID L.STEVENS.Internetworking With TCP/IP VOl II:Design, Implementation, and Internals (Second Edition) .1998.

[3]Kenneth R.Castleman.数字图像处理 (新版) [M].北京:电子工业出版社, 2002.

化解数字视频的技术障碍 第5篇

其发展主要表现在:数百万像素功能的低成本数字摄像头不断涌现;低成本高清(HD)监控器的出现,具有压缩协处理器的新型DSP的推出;IP技术的普及与统一站点网络融合;以太网供电(PoE)技术推进成本下降,且不用再为每个摄像头配备电源;以及大容量存储设备成本下降等。此外,内置计算功能的新一代摄像头已经上市,可执行视频分析功能,并承担一定处理任务,将操作人员从繁重的监控工作中解放出来。

这些重要技术发展趋势有助于安防人员处理、显示、评估并存储大量视频内容,这些视频是通过无所不在的监控摄像头收集而来。

带宽、延迟以及存储容量仍然是主要技术难题

安全技术人员很清楚地认识到,监控解决方案的视频要求与“好莱坞大片”式的视频完全不同,不是在摄影棚里拍摄的。安全监控摄像头通常要工作在光照较暗、对比度较低的环境下,而且摄像头所在位置通常对捕获目标区域都不是非常理想。

非常幸运,安全监控系统的主要目标是人员、物体或特定区域,因此通常不需要广播级的影像质量。针对高端应用而言,系统或许需要较高分辨率进行捕获与读取某些信息,如在恶劣环境下捕捉并读取行驶车辆的车牌号。

北美电视标准帧速率为每秒30帧,有源影像分辨率为720 X 480像素。安全监控系统的分辨率与帧速率可以远远低于该标准,因为其根本不需要捕获所有细节。这样就可大量获得存储与通道密度等优势。因此,许多模拟安全监控系统的运行帧速率仅为7.5 FPS,影像分辨率则仅为352 X 288像素(CIF标准)。

通过降低帧速率或分辨率,在一定带宽下甚至可支持四个摄像头影像,而不仅是一个。如果同时降低帧速率与分辨率,正常情况下,一个摄像头影像所占带宽就可支持16个摄像头的影像。当然,节省带宽也是有代价的,即影像质量下降。在帧速率为7.5 FPS时,画面可能会不流畅,在影像分辨率为352X 288像素时,细节可能比较模糊,不过操作人员通常仍可分辨出场景内容。在传统系统中,通常要通过降低帧速率或分辨率或同时调低这两个参数,来实现降低成本的目的。

新型摄像头技术改进了压缩方法,并采用更低成本存储设备,这样系统就可支持更高的帧速率与分辨率,通常可达720 X 480全像素分辨率与30 FPS帧速率。若有需要,新型系统也可通过编程采用较低的帧速率或分辨率降低成本。

安全监控系统的另一关键要求就是低延迟,延迟涉及两方面内容,一是视频显示在显示器上所需时间,二是摄像头平移与缩放某一可疑事件的速度。实时视频监控有时会因延迟较长而受影响,导致操纵杆控制与摄像头的移动不同步。之前,模拟电视系统的发射延迟总是要比IP视频系统好。要想降低数字视频延迟,就应解决以太网多变的延迟与损失问题,还要解决视频编码与解码本身造成的延迟。通常情况下,确保良好网络基础局端,并采用高级编解码器与视频压缩技术,即可解决上述问题。

视频存储也是一个挑战,因为大多数安全监控系统都必须支持存储功能,要在几天、几周、几个月乃至几年后还可将视频内容调出来检索。系统应将高效压缩算法与低成本大容量存储设备结合起来,这样才能满足必需的数据存储量,不过考虑到数据量确实非常大,存储技术还应该能够标记并快速跳转到特定部分,比如直接跳到有人出现,或者某辆车驶离停车场等某帧。

这种要求就催生了视频分析,计算机可进行分析运算,识别目标事件并将其标记下来,以供人工解释或其进行其它操作。

根据不同应用采取不同压缩方法

正如前部分提到的那样,压缩方案对实现强大视频安全监控系统至关重要。多年来,不同的压缩方案层出不穷,不过安全监控系统一直主要采用MPEG与H.264标准。这些算法会频繁采用参考影像,后续影像只存储相对于参考影像发生变化的信息,这就有助于将影像尺寸降到最低。

帧预测不一定总是最佳解决方案。在帧速率较低时,不同影像间的变化可能较大,这时,这种运动估计节省的带宽就非常有限。不过,更新的成本新技术进步是采用必要而实用技术(如MPEG-4与H.264编解码器),以支持电视画质的帧速率。

实现MPEG算法的压缩标准在视频系统中很受欢迎。请注意,MPEG实际包含了多个标准。MPEG-2是一种较早期的标准,主要用于DVD与广播视频,而MPEG-4则可针对特定比特率实现更加清晰的画质。H.264则是最新增加的标准,也称作MPEG-4 Part 10或高级视频编码标准(AVC),该标准具有更高的压缩性能。

一般规律是,标准30 FPS模拟摄像头采用H.264压缩技术,比特率是1Mbps。通常MPEG-4所用带宽高于50%,而MPEG-2所用带宽又要比MPEG-4多出50%。

要实现这种高质量压缩,运行压缩算法的计算能力就会相应提高,这会导致成本提高,乃至延迟时间加长。但是,随着信号处理器功能变得日益强大,价格不断降低,这种计算性能提高的负面影响在今后几年会有所降低。

系统集成商或安全管理人员必须确定系统可接受的最低视频质量,这决定了视频的影像解析度与帧速率,配合所用的编解码器,也就决定了视频所需的数据传输速率、计算量以及存储空间大小。目前,MPEG-2算法用于原有系统中,而新系统则不采用这种算法。MPEG-4是一种处于中间水平的压缩算法,常用于低端系统。H.264则是新系统常见的压缩算法选择。

视频分析技术有助于简化网络,减轻存储空间负担

一些因素推动压缩算法从MPEG-4向H.264转变。自MPEG-4被开发出以来,工程师不断改进压缩技术,很多是在H.264上的创新,这种新算法不是只使用一个参考帧,而是采用多个参考帧,而且支持尺寸可变的预测块。

根据具体实施的特性与选项的不同,压缩效率会有很大差异,不过总体说来,计算开销与延迟间可以进行一定的折中。因此,采用H.264压缩算法时,人们可以从一些预定义的特性集中选择(也称作配置文件),其中的H.264高规范可以支持低延迟多解析度视频的数据流,而这正是视频监控应用的重要要求。此外,在视频质量与比特率之间折中平衡时,有许多可调节的“旋钮(knob)”,必须作出适当的设置。

如前所述,延迟问题非常重要。目前,如果从事件发生到事件在屏幕上显示出来有100毫秒延迟通常还可以接受。我们最好把延迟作为系统级问题来解决。由于延迟非常重要,因此系统应将原始视频直接提交预览显示,而不应先传输到录制/存储系统,然后再显示。当然,不同的压缩算法会在原始数据与存储影像之间造成不同程度的延迟,我们建议关注延迟问题的系统开发人员认真考虑采用H.264压缩算法。

人们还会关注视频数据的传输问题,即有没有足够的带宽实时传输所有影像数据。在采用内置硬盘的模拟摄像头与DVR的混合系统中,DVR必须具备足够高的带宽以处理所有视频馈送。即便就完全采用IP摄像头输出的数字馈送,也会出现同样的问题。编解码器与比特率的选择也会对网络和存储设备是否适用产生影响。

在安全监控应用中,我们必须避免网络过载,因此轻载(over-provisioning)是最好的解决方法。100Mbps以太网通常可以非常可靠地支持8个1Mbps摄像头,而10Mbps以太网则难以胜任。当然,最终决定要取决于采用什么样的交换机与集线器。存储技术也肯定会对安全应用造成影响。不过,我们不见得一定要一直传输所有数据,可以仅在发生特定情况的时候传输数据。新型智能摄像头与DVR采用智能视频分析技术,能根据用户编入的事件对影像进行检查,检测是否发生了感兴趣的事件,比方说有人出现、有人离开等。常见的视频分析范例包括:检测潜在的可疑活动,比方说是否有人在敏感区域徘徊;监控交通状况;机场安全监控;以及检测是否有遗留下来无人看管的物品等。利用分析技术,我们可仅在发生特别事件的情况下才传输或存储视频,这就降低了整体网络和存储需求。

分析功能正日益成为安全应用的必备特性,因为它有助于操作人员更高效地开展工作。例如,如果我们通过人工盯着多部摄像头画面来监控活动目标的话,就会消耗大量时间,甚至可能发生误报或者漏报。在没有智能化支持的情况下,视频监控只是一种被动的工具。分析技术能帮助我们缩短检测到安全机制遭破坏并发出警报的时间,避免反应过慢,贻误战机。

设计出优化视频智能的系统

DSP能支持更高的帧速率,相应提高视频画质,改善压缩,确保可接受的带宽占用,并支持视频分析功能,从而引领趋势发展。TI等供应商提供的高性能处理器通常能支持7200MIPS的高性能,而时钟频率在1GHz以下,有助于快速执行复杂算法与操作。

上述处理器与高级软件相结合,将监控摄像头与DVR技术提升到一个新的层次,实现了智能视频分析功能。借助ObjectVideo OnBoard等专用软件,制造商已能够开发出新型监控产品,以执行可靠的智能视频功能,如分析视频、生成警报,并能根据用户定义的规则生成其它可执行的信息。

这种高级视频内容分析技术能帮助用户确定相关对象,并根据这些对象的活动作出判断。例如,判断他们是否穿过了视频绊网(video tripwire),闯入特定区域或只是出现在摄像头视角范围之内。智能设备根据有关规则进行处理,以便与视频分析进行实时比较。通过选择只输出警报情况下的视频数据,还能优化网络带宽。此外,智能监控摄像头还可用于需要在关键环境下及时采取防范措施的安全应用,这些环境包括机场、边境管制以及商业财产等。

比方说,有的摄像头实现了超过120 dB的超宽动态范围传感器,克服了光线不足环境下的影像退色问题。这种摄像头还采用可选MJPEG和H.264压缩技术,以满足用户要求,帮助他们以更高的影像质量或更低带宽传输视频数据。

通过充分发挥DSP技术优势,摄像头可执行视频分析功能,减轻了传输实时视频至机房服务器(backroom server)的网络负载。智能摄像头可运行整套分析功能,而成本仅为专用服务器的一小部分,用户还能轻松定义摄像头视角规则。还有一种应用设计方案,则是采用协处理器,通过子卡来减轻高端视频分析工作的处理负载。例如,ARM处理器可用于在影像管道中执行简单的运动检测,但我们可添加DSP协处理器,这样中端或高清摄像头就能获得足够高的性能,来满足高级视频分析功能的需求了。高性能DSP可执行视频内容分析、视频压缩与编码,以进行视频传输与存储,而ARM处理器则负责其它任务与联网功能,以及MPEG-4与JPEG编码等。

通过在协处理器设计中集成HD MPEG-4,我们可以提高摄像头的灵活性,实现双数据流功能,支持可拆卸存储,提高数字缩放功能,并扩大摄像头视野,此外更不要说还能通过集成影像管道所带来的成本节省优势了。

数字视频智能编辑算法研究 第6篇

据统计,人类获取的信息约60%来源于视觉,20%来源于听觉,另外20%来源于触觉等其他途径,由此可见视觉信息的重要性。其中,视频是视觉信息传播的主要媒体,然而在视频制作过程中,常常有一些特殊要求,如场景中的字符或人脸留下一些影响视觉效果的斑点需要去除等。如果按传统的方法,就必须重新拍摄该视频片段,或者用现有的一些PS工具一帧一帧地手动处理该视频片段,制作慢,成本高。

为此,笔者创新性地设计了一种数字视频智能编辑系统,旨在智能地处理视频中的小瑕疵,文章首先利用图像跟踪技术实现对连续帧中的小瑕疵跟踪,再利用图像修复技术,去除这些瑕疵的影响,从而达到了视频制作的低成本、高效率、高质量目标。

2 目标的跟踪

图像跟踪技术[1]是在对图像序列中的目标区域进行检测的基础上,对目标在后续图像中的位置和状态进行预测、估计。根据跟踪目标表示方法的不同,可将图像跟踪算法分为基于区域、特征、轮廓的跟踪算法3种。

不同的算法各有其优缺点,适用的场合也不同,因此一种算法的优劣取决于其处理的目标对象的特点。本文的处理对象是视频中的小目标,由于目标区域小,纹理信息少,特征点难以提取,因此基于区域的跟踪算法是一种较为适合的算法。由于基于区域跟踪算法几乎没有抗形变、伸缩的能力,该算法的应用场合非常受限;另一方面,由于跟踪目标的背景占有较大区域,往往含有丰富的信息,这些信息有助于实现目标的精确跟踪。综合考虑这两点,提出了一种结合Kanade-Lucas-Tomasi(KLT)算法和块匹配算法的跟踪算法,其中KLT算法利用背景领域的纹理特征,得到形变仿射信息,完成初步处理,再利用块匹配算法精确跟踪目标。

KLT算法[2]是一种以特征点窗口在帧间的灰度差平方和作为度量的跟踪算法。KLT算法先在图像上选定含有纹理信息的窗口作为特征点,再对每个特征点进行跟踪,根据特征点跟踪结果,计算图像帧的仿射形变和位移变换,同时在跟踪的过程中,不断判断在后续帧的特征点是否丢失。因此,KLT算法能够解决跟踪目标伸缩、遮挡问题。

对灰度图像的特征点窗口W,KLT算法假定图像在t+τ时刻的像素I(x,y,t+τ)和t时刻像素I(x,y,t)满足关系

对于特征点窗口内的各个像素,其唯一近似表示为

式中:为特征窗口的形变变换,X为像素点的位置,d=(dx,dy)为特征中心点的位移。

令A=I+D,I和J分别表示待匹配的两帧图像的特征点窗口,则由上述分析,I和J

KLT算法就是要寻找A和d,使得特征点窗口的灰度差平方和SSD最小

式中:w(X)为权重函数,通常可以取1,或为了强调中心纹理,取高斯分布函数。

当式(4)取得最小值时有

式中:,为图像的灰度值梯度。

当u=DX+d为小量时,可对J(AX+d)进行泰勒展开,并将待求运动参数D和d提取出来,问题可表示为

因此,KLT的迭代步骤为:

1)假设i=0时,D0=0,d0=0,即A0=1,J0=J(X),设置迭代终止条件min(ε),最大迭代次数N;

2)计算式(4),若ε≤min(ε),停止迭代,所得Di,di即为所求;

3)判断迭代次数,若i>N,停止迭代;

5)根据式(6),计算Di,di;

6)由5)的结果,计算Ji,返回2)。

在KLT跟踪算法中,并不是所有包含纹理信息的特征窗口都是适合跟踪的,只有对那些特征窗口,满足矩阵T的子矩阵Z的两个特征值λ1和λ2满足条件λ1,λ2>λmax时,此特征窗口才具有较好的跟踪效果。由于本系统考虑的是小目标的跟踪,被跟踪的目标往往缺乏丰富的纹理信息,因此直接用KLT进行跟踪会导致跟踪丢失甚至错误跟踪。但对于跟踪目标的背景环境,存在着丰富的纹理信息,因此本系统采用KLT算法来确定图像的仿射变换,最后将仿射变换后的跟踪目标,用块匹配跟踪法,在图像帧中精确跟踪出目标。

块匹配[3,4]算法是一种通过计算跟踪对象在图像帧间的相关性的跟踪算法。为了提高本系统的性能,系统对传统的块匹配跟踪算法进行了改进,结合三步搜索算法,实现块匹配跟踪。

如图1为跟踪算法的实验结果,其中图1b,1c分别为单纯使用块匹配法跟踪的结果,显然它不能处理形变伸缩的序列,而图1d,1e是结合KLT算法的块匹配跟踪结果,从结果可见,目标得到了精确的跟踪。

3 目标的修复

完成了对目标的正确跟踪后,下一步就是要对跟踪到的目标进行修复,得到期望的图像。图像修复技术主要分为图像细纹修复技术和图像纹理合成修复技术。

与传统的需要迭代的修复方法不同,Telea提出了一种快速的非迭代的修复算法。该方法根据像素与结构信息计算区域内已知像素所应有的权重,采取与缺失区域几何信息相关的修复顺序,根据邻域内像素加权来确定未知像素的值。

图2为Telea算法的示意图,假设待修复点集为S={x1,x2,…,xN},对于待修复点xk,确定其邻域为

即距离修复点xk小于δ的所有已知点(包括已被修复的点)。则被修复点xk的像素值就是邻域内所有点的加权平均

式中:wh(xk,y)为权重系数,对于离散图像有

式中:为图像的梯度估计,对于连续图像有

这样的权重估计,保证了距离待修复点较近的已知点具有较大的权重,靠近修复方向的已知点具有较大的权重,符合了Telea的信息传递的方向。由于Telea图像修复法只根据图像破损区域的几何特征确定向内修复的方向,可能导致信息向内的错误传递,并且有不连续的现象。但在本系统中,由于考虑的是视频中小目标破损区域,还不会出现Telea算法本身缺陷导致的问题。同时由于Telea算法不需要迭代计算修复权重,还是一种快速的修复算法。总之,针对该视频图像智能编辑系统,Telea算法可以在不影响视频修复质量的基础上,达到快速修复的目的,因此是本系统一个较佳的选择。

4 数字视频智能编辑系统以及实验结果

根据前面的分析,本文设计的智能编辑系统的数据处理流程为:首先用KLT算法计算图像帧的形变仿射系数矩阵,根据该系数矩阵,计算待匹配区域仿射后的模板,之后,利用块匹配算法,在后续帧中找到此模板的匹配区域,最后利用Telea细纹修复算法完成对匹配区域的修复。

如图3所示,为该智能编辑系统的试验结果,该图片序列为电影中截取的片段,其中图3a为截取片段的第一帧,该试验的目标是:用户先在图像上圈出待修复的区域,即脸颊上的痣;然后该系统自动在后续帧中定位该痣在图像中的位置,并将其去除。为了说明问题,该系统随机地选取了智能修复过程中两帧图像的跟踪和修复结果,如图3b,3c分别为图像序列第13帧和第76帧的跟踪结果,图3d,3e分别为图像序列第13帧和第76帧的跟踪并修复的结果。从图3可以看出,本文设计的数字视频编辑系统可以很好地对图像中的小目标进行跟踪并修复,从而实现了视频的智能编辑的目的。

5 总结

文章以视频制作应用作为切入点,针对视频拍摄中不可预见的因素而导致视频拍摄片段中出现不希望出现的小瑕疵的状况,设计了一种数字视频智能编辑系统。该系统可以在用户干涉极少的情况下,自动地去除图像上不期望的小瑕疵,加快了视频制作的速度,同时也大大降低了视频制作的成本。

参考文献

[1]YILMAZ A,JAVED O,SHAH M.Object tracking:a survey[J].ACM computing surveys,2008,38(4):45.

[2]JEON H,JEONG J,BANG J,et al.The efficient features for tracking[J].IEEE International Conference on Tools with Artificial Intelligence,2008,(11):241-244.

[3]HARIHARAKRISHNAN K,SCHONFELD D.Fast object tracking using adaptive block matching[J].IEEE Trans.Multimedia,2005,(10):853-859.

浅析数字视频传输系统 第7篇

1 数字视频与模拟视频的异同

首先,数字视频信号和模拟视频信号在传输还原质量上有明显的不同。采用数字信号传输系统时,数字接收器的电路只需要判断出所收到信号中每个数据位的“高”或“低”状态,便可以完整地复原所传输的信号。而在模拟传输链路中,每一级放大都会带来附加噪声,使信号劣化,因而不可能将视频信号完完全全地复原出来。采用模拟传输方式,良好的系统设计可以让原始信号得到比较真实的还原,但是这种还原的结果永远不可能和原始信号完全一致;而采用数字传输方式,就可以做到完全一致的信号还原。

其次,电缆对数字信号的影响与模拟信号不一样。我们熟悉模拟信号在电缆中的传输,随着电缆长度的增加,信号电平和高频特性随之逐渐下降,它对图像的影响是渐进的,图像会逐渐变模糊但不会消失。而电缆对数字信号的影响不是渐进,而是突变。只要接收端可以恢复原来的数据,则信号质量不受任何衰减,即10米的电缆与15米的电缆,其传输数字信号的质量是一样的,但逐渐增加到某个长度时,视频信号重现质量突然恶化,有时电缆长度仅差几米,其图像可从完好变为完全没有。这种数字视频传送中特有的现象叫“峭壁效应”。

此外,在指标特性和对整个传输链路的时基要求等方面也有很大不同。以前模拟信号中的一些常用的术语,比如电平、峰值,被数字信号领域的均衡、抖动和重计时术语等所取代。数字信号的调节、修正要求也跟模拟信号不同,在进行数字化视频传输系统设计之前必须有所了解。

2 数字视频信号剖析

所有标准的数字信号格式,包括HDMI、SDI、DVI以及DisplayPort,都是同步信号,也就是说,同步数字信号的值只会在某个参考信号(即时钟信号)所规定的特定时间间隔内才会发生改变。数字视频信号的本质是二进制的,信号或者是高电平,或者是低电平,并在两种状态之间迅速切换。参见图1。

数字信号从低到高的变化时间称为上升时间,而从高到低变化的时间称为下降时间。信号电平的高低之间的差值,叫做信号摆幅。变化之间所允许的最小时间间隔,叫做时钟周期。

由于数字信号是二进制的,所以它本身非常稳定,因为接收端只需要在每个时钟周期内判断出信号电平是高还是低,就可以把原始信号完整地复原出来。但是,当信号摆幅下降时,或者当时基不够精确时,这种复原的难度就会增大。线缆衰减、线缆分布电容、阻抗失配、噪声耦合、串扰等问题,都会导致上升和下降时间、信号摆幅以及时基精确性的劣化。对信号劣化程度的定量分析非常重要,这样才能对信号的完整性标准进行界定。如果信号的劣化程度过于严重,使接收端无法在正确的时基内判断信号的高低值,那么接收端输出的信号就毫无意义,造成信号丢失,也就是所谓的峭壁效应。这和模拟传输不同,信号变差的时候,模拟传输中的接收端的输出信号也会随之劣化,但是仍然可以看到图像。

时基错误的一个主要原因是抖动。抖动是指时钟周期相对于参考时钟信号的偏差。抖动产生的原因可能是采用了尺寸较长的低质量线缆,或是在信号源和目标设备之间串联了若干数字设备所造成的累积效应。

我们可用“眼图”来定量分析数字信号的完整性。获得眼图的方法是通过示波器来连续采集一系列数字脉冲,并将这些采样的图像叠加显示在示波器屏幕上(如图2)。

从所得图像中可以看出传输信号的累积电平和时基特性。图3中波形像眼睛一样的部分就是眼图名字的由来。要判断信号的值是高还是低,应当在这些眼状图形的中心点对应的时间间隙内对信号进行捕捉。也就是说,这些时间间隙同样对应着信号升降变化的中心位置。“眼睛”张开得越小,就越难以精确判断信号的值,数字视频格式规范中,规定了眼睛张开的最小值,以此作为信号完整性的最低标准。在进行信号的定量测量时,可以把这个值以某种参考或限制性掩蔽的方式加入到眼图中。

3 如何保持数字信号的完整性

一个简洁的数字信号传输链路是确保信号完整性的关键因素。线缆长度不能超出数字信号源的驱动能力范围,因为随着线缆长度的增加,线缆的分布电容和衰减会导致信号上升时间和振幅的劣化。由于DVI、HDMI和DsiplayPort信号都是通过双绞线进行传输的,当线缆较长的时候,由于布线过程中造成的个别绞线对绞率改变,会引起一些偏差,从而导致视频数据线路之间的相对时间受到影响。图4的眼图显示的是由于线缆过长引起的衰减和时基错误给信号带来的失真。图中的波形已经超出了掩蔽限制范围,这种信号造成的结果可能是图像不稳定,甚至无法显示图像。

在数字视频设备内,可以通过输入信号均衡、输出信号重计时等方式对信号进行修整。这些高级的功能可以补偿信号链路中的损耗。要注意,这类损耗并不仅限在信号链路中,有时候也会和信号源设备本身有关。信号源设备直接输出的信号也可能会存在问题。有些情况下,不可避免地要用到尺寸很长的线缆,这时候采用有源线缆均衡器可以修复信号的完整性并延长驱动距离。有源均衡器是设计用来补偿长线传输带来的影响。通过与线缆损耗相匹配的放大器和滤波器,来修复信号摆幅以及上升和下降时间。时钟和数据恢复电路可以消除抖动,修复时钟时基,从而让眼图张开。图5所示的眼图是对图4的信号采用双绞线延长器修复后的结果。输入均衡和输出重计时等信号修复功能是很多数字传输产品解决方案的常见功能,需能掌握应用。

随着视频分辨率以及相关的信号频率增加,信号对线缆中不连续的地方越来越敏感。这些不连续的地方会产生信号反射,从而使信号劣化。因此,线缆的弯折半径要尽可能大,并且避免采用绞接、插接或公母转接头等连接方式。如图6显示的是仅仅在两根线缆中间加入一个接插头后所带来的信号劣化。

图6中眼图显示的是一个1920×1200的信号通过一段6英尺(1.8米)的DVI线缆后,接着通过了一个DVI的母头对母头的转接头,最后经过另一根6英尺(1.8米)的DVI线送出来的信号。这个例子充分说明了良好的设计规划对于高清数字系统的重要性,要尽可能减少系统连接节点,并且信号分配设备一定要具有信号修整功能,从而解决可能发生的信号完整性问题。

4 延长数字视频信号传输距离的解决方案

在专业音视频领域,如会议室、指挥中心、大型商场等场所的音视频系统设计,经常会碰到把高清数字视频信号传输几十米、甚至上百米远。而一般的HDMI、DVI等高清成品线缆传输距离在15米以内;另外,绝大部分固定安装场合下,都要求线缆沿墙内、地板下或吊顶内敷设,这时候很难使用成品线布线,因为成品线的插头太大,无法穿过穿线管或线槽,而在工地现场工具有限,也很难给HDMI和DVI线做连接头。即便是可以穿线,一般标准成品线的性能也很难满足较长距离传输的要求。

为解决远距离传输的问题,很多专业厂商都推出了合适的产品解决方案,可以灵活满足特定的系统需求。成品信号线的替代解决方案之一是采用一对有源的信号发送器和接收器,将信号通过标准的5类双绞线或光纤进行传输。这种方法便于在墙内和家具内进行布线、便于在工地现场制作接插头同时还能有效地延长信号的传输距离。

5 类双绞线是一种廉价的方案,它便于安装和制作接插头,可以支持100米以内的传输距离。

如果需要更远的传输距离,比如要传输几百上千米,或者出于安全保密性的考虑,或是外界电磁干扰很大的场合下,采用光纤传输产品是很好的解决方案。光纤传输具有如下优点:

(1)传输图像质量高:传输图像的像素性能可以达到1920×1200的分辨率以上。

(2)传输距离远:一条单模光纤可将高清视频图像传输30km远。

(3)无外界干扰:可以用在不适合采用铜质线材的高电磁辐射环境下,比如电梯井或是靠近空调或其他电气设备的地方。

(4)安全保密性好:非常适合政府、军队和司法等场所。

在设计视频传输系统时,除要考虑以上因素外,还需了解HDMI、DVI、SDI等数字接口的定义、特性;需了解EDID数据的传输和管理;需了解数字内容加密保护的相关内容。只有全面掌握数字视频系统的相关技术知识,才能做到以最少的设备、最少的传输环节、最简便的施工,达到最好的传输显示效果。

摘要:数字视频传输与模拟视频传输有很大的区别,通过了解数字视频信号的特性,解决数字视频传输中碰到的问题,设计好数字视频传输系统。

浅谈数字视频水印技术 第8篇

关键词:数字视频,数字水印,视频水印

由于媒体内容的数字化给盗版与侵权带来了便利, 使得数字化浪潮下的版权保护问题成为制约数字媒体产业发展的瓶颈之一。2012年暑期档影片《画皮2》, 上映不久便有盗版在网络上大肆流传, 影片的著作权人华谊兄弟根据相关的水印信息分析, 确认出视频的盗版源是马鞍山大华时代电影大世界影院, 而北京腾度网络科技有限公司将来源于该公司的《画皮2》置于网上并向用户提供在线播放和下载服务。图1所示为影片的宣传海报, 此案件给影片带来了巨大的损失。分析《画皮2》的水印信息, 追溯盗版, 确定非法复制源, 从而对数字媒体的版权进行保护, 这正是数字水印技术的主要研究意义。

1 数字水印的基本原理及框架

视频数字水印就是以视频为载体添加数字水印。数字水印技术实质上是一种信息隐藏技术, 它的基本思想就是将版权信息嵌入到数字图像、音频、视频、文档等数字对象中, 从而保护数字多媒体的版权、证明产品的真实可靠性、跟踪盗版行为或者提供产品的附加信息。

一般来讲, 数字水印系统包含三个基本部分:水印的生成、嵌入、提取或检测, 如图2所示。通过相关的水印生成算法生成隐秘信息 (如版权信息) 形成水印, 将水印嵌入到数字内容中得到含水印的数字内容, 使用解密密钥结合水印算法提取或检测出水印, 从而实现对数字内容的保护与监测。其中, 在数字媒体传输的过程中, 会受到各种攻击, 企图破坏或修改水印, 这就要求数字水印能够很好的抵抗各种攻击。

2 数字视频水印的特点及分类

对数字媒体而言, 数字水印的主要作用是:1) 保护源数据;2) 盗版取证和追踪;3) 数据加注解和访问控制;4) 篡改提示与完整性保护;5) 保护许可证信息。

2.1 数字水印的特点

数字水印本身的特性可以帮助它在不知不觉间实现对数字媒体的保护。一般来说, 数字水印具有以下三个基本特征:

1) 鲁棒性。这是数字水印的最基本要求, 即数字水印应该能够抵抗各种有意 (如马赛克攻击、统计平均攻击、线性共谋攻击等等) 或无意 (压缩、滤波、噪声污染、各种几何变换等等) 的修改或恶意攻击。这样既保证了数字媒体的高品质, 同时也保护了作者的利益。

2) 不可见性。水印的嵌入对数字媒体造成的变化不能被轻易察觉到, 同时也不能影响数字媒体的正常使用, 从而确保数字媒体的商业价值。可视水印除外。

3) 安全性。嵌入数字多媒体的水印信息应是难以被篡改或伪造的, 未经授权的用户是无法正确地检测、提取或是移除水印的。

2.2 视频水印的特点

视频不同于静止的图像, 是由一系列连续等时间间隔的帧图像构成, 受人眼视觉系统、视频的压缩编码以及专门针对视频的攻击形式 (如帧间组合、帧删除等) 的影响, 使得视频水印的研究更具有挑战性。除了具备上述数字水印的基本特点外, 视频水印还有其自身的特点。

1) 实时盲检测性。实时动态的视频流, 水印的嵌入和提取必须在短时间内完成, 从而确保视频的实时编解码。同时, 原始视频难以获得, 水印的检测要必须满足盲检测的要求。

2) 与视频编码标准相结合。由于视频数据量庞大, 存储和传输中常常先进行压缩编码。而水印可以嵌入在原始视频中, 也可以在压缩视频中, 甚至还可以在编码压缩时嵌入。因此, 水印的设计必须考虑视频压缩编码标准, 从而保证在视频压缩编码过程中水印信息不丢失。

3) 随机性检测。对于视频而言, 水印的检测必须能够在视频的任何位置实现, 而不是按视频的播放顺序一步步检测。

虽然水印的鲁棒性、不可见性以及容量之间存在一定的矛盾, 只要在实际应用中折中衡量, 就能设计出符合要求的视频水印, 如图3所示, 为水印特点间的关系。

2.3 数字视频水印的分类

目前, 数字视频水印随不同依据有不同的分类, 也没有统一的分类标准。关于数字视频水印的分类如图4所示。

3 数字视频水印的主要应用

现有的数字水印主要应用于三个领域:以鲁棒数字水印为代表的防伪技术, 以脆弱数字水印为代表的防篡改技术, 以及以数字指纹、数字签名为代表的认证技术, 如图5所示。

版权保护。此类防伪技术主要提高水印鲁棒性, 在经历多种信号处理操作或攻击后, 水印信息不会被破坏也不会被轻易移除。同时增强水印的不可见性, 使得攻击者无法确定水印的位置, 从而降低攻击的破坏力。通常是将载有创建者、所有者的标识信息或者是所有者序列号的信息作为水印信息, 来实现对数字视频的版权保护。一旦发生版权纠纷, 可以提取并检测水印信息来证明版权归属问题。

内容鉴定。有时需要检测视频内容是否遭到恶意更改或伪造, 确保视频内容的真实性与安全性。用于认证技术的脆弱水印, 即使是轻微的变动也会造成水印信息的破坏而无法提取并检测, 嵌入了此类水印, 不仅可以感知视频内容是否被修改, 还可以对修改信息进行定位。这类水印除了应用于内容认证方面外, 在广播监控中也发挥着举足轻重的作用, 由于脆弱水印有较强的敏锐性, 可以通过检测水印来监控广播是否按照协议正常播放。

拷贝控制。随着计算机与网络的普及, 未经授权的视频拷贝与传播极为便捷, 也就是说, 即使是刚上映的影片, 盗版影片在其首映当日就有可能大肆传播。所有者可以在发行的每个拷贝中嵌入不同的指纹——指纹水印, 然后将嵌入了指纹的数字视频分发给用户。如果发行商发现了盗版行为, 可以根据数字指纹体系中的拷贝分发体制和跟踪体制, 实现对非法分发者的跟踪并审判。正如《画皮2》中, 华谊兄弟公司通过对检索盗版影片的指纹追踪其源, 从而确定出非法复制的来源, 然后对盗版者进行起诉, 最终实现了版权的保护。

4 数字视频水印的发展现状及趋势

自1994年Van Schyndel在ICIP 94会议上发表了第一篇题为《A digital watermark》的数字水印文章以来, 各国学者展开了对水印技术做深入的研究。目前, 数字视频水印的发展主要经历了两个阶段。

第一代水印主要侧重于将水印信息扩展到帧中所有的像素中, 减少算法的复杂度, 增加水印的强度, 这一阶段水印的主要特点是与视频内容无关。第二代水印侧重于水印在时间和空间上的同步性, 水印信息与视频内容相结合, 可以抵抗与帧相关的攻击, 与第一代水印相比具有明显的优势。而视频水印算法未来主要的发展方向是基于视频内容或特定属性的算法。

数字水印技术自产生到发展已经取得了很大的进步, 但其主要是集中于静止图像的研究, 而对视频方向研究的深度、广度以及成熟度等方面都远滞后于图像。不仅由于数字视频数据量大, 更受限于其高度复杂性, 使得面向数字视频水印的技术具有更大的挑战性。数字视频水印除了在其原有的应用领域中不断优化与完善之外, 还将扩展其应用到其他领域, 在此笔者主要提出了三个未来的应用趋势。

1) 随着互联网技术的发展、三网融合的逐步深化, IPTV的出现将视频与IP相结合, 网络带宽有限、拖布结构异构性等, 使得视频在网络的传输中经常出现丢包与出错的现象, 对水印的鲁棒性形成了巨大的挑战。与IP相结合的视频水印的研究是迫切需要的, 水印的算法不仅要具有更好的实时性, 还有考虑水印的容量以及长度。

2) 下一代视频编码标准H.265的出现, 视频朝着高清晰度、低码率的方向发展, 视频的高效压缩对视频水印技术更加复杂。结合人类视觉特性、新的编码标准, 寻求新的水印嵌入算法以及位置。

3) 人们对视频质量的要求越来越高, 目前对视频质量的评价普遍都是从主客观测量进行的。而基于数字水印的视频质量检测也是未来的一个重要发展趋势, 在视频序列中嵌入水印信息, 在解码端提取水印, 并与原始水印的损伤程度和部位进行比较, 从而评估视频在压缩和传输过程中的质量损伤情况。

5 总结

一直以来, 影片盗版问题迟迟得不到解决, 而此次《画皮2》侵权案件胜诉是国内电影制片发行方首次状告电影院侵权, 将电影著作权维权工作领域延伸至源头。归根结底, 是数字水印技术的在数字视频方面的一个成功应用。随着多媒体技术的发展, 视频数字化, 同时视频压缩技术的逐步完善使得人们可以很方便的使用多媒体产品。现如今, 在充分利用互联网的便利下, 对数字视频进行更好的保护已经成为研究的热点与难点。视频数字水印技术将成为数字水印的一个重要发展方向, 在将来的版权保护、打击盗版方面具有巨大的发展潜力和现实意义。

参考文献

[1]张江, 赵黎, 杨士强.视频水印技术综述[J].计算机应用, 2005 (4) .

[2]Doerr G, Dugelay J L.A guide tour of video watermarking[J].Signal Processing:Image Communication, 2003, 18 (4) :263-282.

[3]Xing Chang, Weilin Wang, Jianyu Zhao.A survey of digital video watermarking[J].IEEE Conference on Natural Computation (ICNC) , 2011 (1) :61-65.

[4]曹军梅.一种用于盗版追踪的抗攻谋数字指纹方案[J].信息技术, 2012 (1) .

[5]毛运柳.视频水印技术研究与应用[D].长沙:中南大学, 2010.

[6]李器宇.视频质量评价系统及其关键技术的研究[D].天津:天津大学, 2012.

上一篇:课堂参考下一篇:综合类高校