《3D H.264视频无失真漂移隐写算法研究》宋广华著|(epub+azw3+mobi+pdf)电子书下载

伍秀英

2022-7-12

好书推荐

图书名称：《3D H.264视频无失真漂移隐写算法研究》

【作　者】宋广华著

【页数】 154

【出版社】武汉：武汉大学出版社 , 2018.12

【ISBN号】978-7-307-15539-8

【价格】30.00

【分类】三维动画软件-算法分析

【参考文献】宋广华著. 3D H.264视频无失真漂移隐写算法研究. 武汉：武汉大学出版社, 2018.12.

图书封面：

3D H.264视频无失真漂移隐写算法研究

图书目录：

3D H.264视频无失真漂移隐写算法研究

《3D H.264视频无失真漂移隐写算法研究》内容提要：

本书主要研究面向3DH.264视频的无失真漂移隐写算法及其鲁棒性、可逆性。根据最新3DH.264编码标准，研究以3DH.264视频为载体的隐写算法，并提出适应3DH.264视频编码的具备高不可感知性的无失真漂移隐写算法，进一步研究算法的鲁棒性和可逆性。考虑到隐写技术对于行为的隐蔽性，重点研究无失真漂移的视频隐写算法，以实现更好的不可感知性。

《3D H.264视频无失真漂移隐写算法研究》内容试读

第1章绪

论

1.1研究背景和意义

1.1.1研究背景

隐写(steganography)是指通过把秘密信息嵌匿在载体中让被授权者接收并获取信息内容，但非被授权者无法感知该传递行为及其内容的一种信息隐藏(information hiding)技术，也称隐写术①。研究隐写术就必须讨论与之关系密切并具备很强相似性的另一种信息隐藏技术：数字水印(digital watermarking)。数字水印一般是指在数字化的载体中嵌入特定的信息，以用作媒体认证或者版权保护等。两种技术的相同点是，两者都是将秘密信息隐藏在相应载体中，都利用人眼视觉的感知冗余以及视频帧的数据冗余来隐藏信息，且都不改变载体的基本特征和使用价值。不同之处在于，前者通过对流行大众媒体的信息嵌匿来进行隐秘通信，强调行为和内容的安全性。隐写术重点关注算法的不可感知性(imperceptibility)、鲁棒性(robustness)以及特定场合的可逆性(reversibility)。而数字水印则通过对数字作品的标识等特定信息的嵌入来进行产权识别或其他应用，强调不被修改、删除及可检测性等。本书研究的对象是隐写，重点关注的是在新兴媒体和介质中符合一定需求的隐写算法。

①隐写术英文作“steganography'”，来源于约翰尼斯·特里特米乌斯的一本看上去有关黑魔法，实际上是讲密码学与隐写术的书(steganographia)中。

第1章绪论

2011年被称作“黑客年”。由于私人公司和政府网站的多个数

据安全漏洞，当年共计被盗数据量约在百万GB以上。其中大部分

失窃归因于网络攻击行动“Operation Shady RAT”,它对许多机构的网络进行持续攻击。用户在不经意间打开一个藏有后门软件的邮件或照片，编码命令就会通过防火墙进入受攻击的系统。目前全球正在目睹一个新类别恶意软件的诞生，它最初始于2010年6月针对伊朗核电站攻击的Stuxnet蠕虫病毒，而后2011年9月的Dugu病毒也被证实与Stuxnet密切相关。Duqu的强大之处在于它隐藏在网络普通文件和图片中，利用特殊手段收集被感染系统的数据到病毒系统指挥控制中心。

类似于Stuxnet、.Duqu、Alureon和Shady RAT这样越来越多的隐写术性质的病毒正在进入黑客的“军械库”。隐写术的起源可以追溯到动物界和植物界中存在的“拟态”，它被证明是一种很好的保护自身种族繁衍的方式。与加密技术相比，隐写术的主要特点包括：隐藏传输的信息是嵌入在一个看似无关联的载体上进行的。通信的保密性主要是通过施加到载体上的算法伪装能力体现的。而隐写术对载体的要求主要体现在载体是要容易被客户端欢迎和接受的东西。因此隐写术的检测会比普通的加密技术复杂很多。

隐写术的对头—隐写分析技术主要是通过检测最近的隐蔽通信，检测有隐秘编码的信息软件的比例。十年来，人们对隐写术和隐写分析的研究引申出了两个重要话题，一是数字版权管理业务的权益，二是隐写术被恐怖分子非法使用的问题。不幸的是，据统计，目前隐写术大部分情况下是被用于非法途径，其也被证明是数据泄露的一大罪魁祸首。于是，2006年美国联邦政府有关报告中已经将隐写术定义为增加网络安全危害的一种重要途径，急需成熟的隐写术解决方案来控制隐写术的使用并降低滥用风险。

当代隐写术的发展趋势主要表现在几个分支：数字媒体隐写术，语言隐写术，文件系统隐写术，以及网络隐写术。数字媒体隐写术的历史可以追溯到20世纪70年代，其开发方法包括拼凑、显著位修改、纹理块编码等。这些技术被用于有损或无损的压缩图像中。而语言隐写术主要是通过改变载体文字语言的段落、语序或者2

1.1研究背景和意义

更换同义词的方式来完成的。在如今的隐写术发展中，大量的文字信息，甚至包括垃圾邮件都可能成为文字隐写术的载体。文件系统隐写术是指将隐写信息嵌入一个隔离的计算机环境，从而使其自动搜索磁盘的加密文件以达到获取信息的目的。最新的隐写方式是网络隐写术。网络隐写术依赖于某些网络服务或者网络应用程序的漏洞以掩饰其存在，终端用户是无法感知存在隐写功能与没有隐写功能的网络程序的微小区别的。例如通过公共网络传输的音频，从客户终端很难辨别出是否携带隐写功能。

不可否认的是，利用信息隐藏技术的现代隐写术已经对网络安全构成了极大的威胁。而信息隐写分析术始终落后信息隐写术一步。没有放之四海皆准的解决方案可以完全破解信息隐写术，因此，敦促科研人员针对相应的隐写手段及时更新并发展隐写分析术是目前解决问题的途径。

相比传统的加密技术，隐写可以有效保证“行为”的安全性。隐写算法实现的一般是点对点的隐蔽通信，只有进行通信的双方才知道秘密信息的存在。如果通信的双方采用的是传统的加密技术，第三方截获到的将是一堆“乱码”，虽然不能获取隐蔽通信的内容，但进行隐蔽通信的“行为”本身已经暴露。可见，在隐蔽通信等领域，单纯采用加密技术无法很好地解决类似问题。由于隐写术一般利用公共信道作为信息传输的通道，将待传输的秘密信息通过一定算法嵌入不被怀疑的大众媒体，不仅有效隐藏了待传输的信息，更重要的是还隐藏了隐蔽通信“行为”，可以实现更为安全可靠的隐蔽通信。基于此，研究并实现利用公共网络环境的隐蔽安全通信成为当今世界主要国家信息安全工作者的共同目标。

(1)H.264多视，点视频编码

隐写方法强烈依赖载体，不同载体的实现方法相去甚远。目前可供选择的载体一般包括文本、声音、图像或视频等大众数字媒

体。当前最主流的视频编码标准是由国际电信联盟(TU)和国际标

准化组织(IS0)共同提出的H.264视频压缩标准。H.264视频压缩

标准以其高效的压缩效率和网络亲和力迅速普及，目前已成为最具

影响力的视频压缩标准之一，以H.264作为压缩标准的视频在互

第1章绪论

联网上已经占据了相当大的份额，对H.264视频编码的进一步研

究一直没有停止过。

多视点视频编码(multiview video coding,MVC)作为H.264标

准的一个部分被提出，是对H.264标准的扩展，其主要目的是适

应当前快速发展的立体视频(3D)。2004年，在MPEG(movingpicture experts group)会议上对于多视点视频编码的标准化被提上日程。2006年，联合视频小组(joint video team,JVT)发布了MVC参考软件模型JMVM(joint multiview video model),模型是对H.264编

解码器的扩展。2009年，多视点视频编码标准作为H.264标准文

档的附录H被正式发布。2012年1月1日，中国首个3D电视频道

开播。目前越来越多的视频载体开始采用立体格式，基于H.264

最新编码标准的3D视频（以下简称3DH.264视频）将会是未来视

频发展的重要方向。

多视点视频是一种新型的具有立体感和交互操作功能的视频，通过在场景中放置多台摄像机，记录下多个视点数据，提供给用户以视点选择和场景漫游的交互能力。多视点视频将在自由视点视频、立体电视、立体视频会议、多视点视频点播等数字娱乐领域有非常广泛的应用前景。随着相机数目的增加，多视，点视频的数据量也成倍增加。系统的一个挑战就是研究实现一种高效的多路编码传输机制，从而对数据进行高效的压缩以便存储和传输视频序列。国

际标准化组织如MPEG已经充分意识到多视点视频这一新的数字

媒体的重要性和应用前景，正在着手制定这方面的标准。

多视点视频指的是由不同视点的多个摄像机从不同视角拍摄同

一景得到的一组视频信号，是一种有效的3D视频表示方法，能够

更加生动地再现场景，提供立体感和交互功能。多视点视频可广泛应用于任意视点视频、三维电视、交融式会议电视、远程医学诊疗、虚拟现实以及视频监视系统等多种正在兴起的多媒体业务。与单视点视频相比，多视点视频的数据量随着摄像机数目的增加而线

性增加。巨大的数据量已成为制约其广泛应用的瓶颈，为此，TU

T和MPEG的联合视频组(JVT)提出了多视点视频编码(MVC)的概

念。MVC主要致力于多视点视频的高效压缩编码，是未来视频通

1.1研究背景和意义

信领域中的一项关键技术，也是国际视频标准化组织正在研究的热点问题。

MPEG早于2001年专门成立3DAV(3 D audio and3 D video)adhoc组研究3DAV的典型应用场景和可标准化的内容。该小组于

2003年7月发布征求意见稿，详细给出了3DAV的需求分析和应

用前景，希望引起工业界的关注。在2004年3月第68次MPEG会

议上，3 DAV ad hoc组分析各研究机构的回应文档后发现任意视点视频受到工业界的普遍关注，决定对任意视点视频的关键模块

多视点视频编码进行标准化。在本次会议上，该小组发布了MVC

征求验证文档，旨在初步验证MVC编码效率的提升空间。

2005年1月召开的第71次MPEG会议共收到7项技术提案。

比较结果表明MVC的编码效率远高于基本编码方案，从而验证了

MVC标准化的必要性和可行性。在此基础上，3 DAV ad hoc组决定发布MVC征求草案文档(call for proposals on multiview videocoding)。该文档的发布标志着MVC标准化正式开始。第75次

MPEG会议文档W7779给出了所提技术与基本编码方案的比较结

果。结果表明提出的新技术能够显著提高MVC的编码效率。在本

次会议上，3 DAV ad hoc组决定将MVC作为H.264/AVC的第四个扩展标准。

考虑到H.264/AVC的标准化工作一直由JVT负责，在第77

次MPEG会议上，MVC的标准化工作正式移交给JVT,这标志着

MVC的标准化工作进入实质性阶段。同时JVT发布了MVC的联合

多视点视频编码模型JMVM,将该模型作为评价MVC性能的公共

测试平台。在2006年10月召开的第78次MPEG会议上，JVT向

MPEG组织提交了MVC的工作草案文档。2008年7月JVT发布了

最终补充草案文档，并对MVC进行一致性测试，以保证其完备性

和准确性。2009年3月发布的H.264/AVC标准添加了附录H,该

附录给出了MVC的语法语义。

MVC的研究最初是由视频标准化组织启动的，由于多视点视

频序列能够提供逼真的视觉感受，MVC成为近期视频编码领域的

研究热点。近年来，学术界围绕MVC举办了多次专题研讨，如

第1章绪论

IEEE Transactions on Circuits and Systems for Video TechnologyMVC专辑，Signal Processing:Image Communication的3D视频专辑，Picture Coding Symposium的专题讨论等。其中MVC专辑详细

介绍了现阶段MVC的主要研究方向，包括MVC的预测结构研究、

多视点视频的运动和视差补偿技术、多视点视频编码中的视点图像

插值和颜色校正等。此外，国内研究机构也纷纷开展了MVC的研

究工作，主要从MVC编码方案设计、颜色校正、视差估计和速率

控制等几个方面开展。

目前多视点视频编码的主要研究内容包括以下三个方面：

①预测结构。在单视点视频编码标准中，帧间预测是去除视频

序列时间冗余的有效方式。为了提高帧间预测的准确性，H.264/

AVC引入了多参考图像预测技术。该技术使用多个参考图像进行

位移估值和帧间预测，从而获得相对精确的匹配块，降低预测差(residual)信号的能量，提高编码效率。在H.264/AVC编码框架下，去除视点间冗余最直接的方式是在编码当前图像时使用其他视点中的已解码图像作为参考图像进行位移估值和帧间预测，这种方法称为视点间预测。如何设计时间预测和视，点间预测以有效利用时

间和视点间相关性是MVC预测结构需要解决的问题。

②提高MVC编码效率的技术。预测结构一经确定后，如何有

效进行视点间预测来提高编码效率是MVC研究的一个主要内容。

根据所使用方法的不同，视点间预测技术大致可分为两类：利用现

有视点间相关性提高MVC编码效率的技术和补偿视点间差异性提

高MVC编码效率的技术。

利用现有视点间相关性提高MVC编码效率的技术：视点间预

测指的是采用邻近视点中已解码的图像作为参考图像对当前待编码图像进行预测。因此，如何有效利用视点间参考图像的信息提高

MVC编码效率是视点间预测的核心内容。根据利用视点间相关性

进行预测信息的不同，视点间预测技术可进一步分为视点间采样点

预测和视点间运动信息预测两大类。补偿视点间差异性提高MVC

编码效率的技术：视点间差异减弱了视点间相关性，致使视点间预