《基于IPv6的分布式网络搜索机制的研究》林玉香著|(epub+azw3+mobi+pdf)电子书下载

图书名称:《基于IPv6的分布式网络搜索机制的研究》

【作 者】林玉香著
【页 数】 173
【出版社】 济南:山东大学出版社 , 2018.10
【ISBN号】978-7-5607-6205-0
【分 类】数字电路-逻辑设计-研究
【参考文献】 林玉香著. 基于IPv6的分布式网络搜索机制的研究. 济南:山东大学出版社, 2018.10.

图书封面:

图书目录:

《基于IPv6的分布式网络搜索机制的研究》内容提要:

本书主要对基于IPv6的分布式网络进行相关研究,内容包括分布式网络模型的相关知识,基于IPv6的混合式分布式网络模型,基于IPv6的分布式网络模型的自适应机制、负载均衡机制、仿真及结果分析,基于自适应对等组的搜索算法,基于JXTA的PAGS搜索模型,以及分布式网络流量检测系统模型。内容系统、完整,理论性较强。

《基于IPv6的分布式网络搜索机制的研究》内容试读

绪论

0.1研究背景与意义

IPv6是国际下一代互联网发展的核心技术和创新平台。我国于2017年11月26日印发的《推进互联网协议第六版(IPv6)规模部署行动计划》,明确提出“用5~10年建成全球最大规模的Pv6商用网络”。作为基础协议,Pv6与5G、区块链、SDN/NFV等最新技术的结合,将成为IPv6下一代互联网发展的强大驱动力,推动产业发展。

2018年是政策推动下IPv6规模部署的重要一年,随着物联网等技术部署带来的海量连接需求,IPv6的需求会越来越大。工信部曾在2018年5月表示,到2018年年末,移动互联网Pv6用户规模应不少于5000万户。其中,中国移动用户不少于1000万户,中国电信用户不少于1000万户,中国联通用户不少于1000万户。

2018年6月20日,阿里云和三大运营商联合宣布,将全面对外提供Pv6服务,并致力在2025年前助推中国互联网真正实现“IPv6Only”(仅支持Pv6)。对于亟待突破性发展的Pv6产业而言,这无疑是个“大动作”。在技术和市场的推动下,我国Pv6产业的发展时机已经成熟,云服务领军企业阿里云率先和三大

运营商携手力推P6全面服务,并给出了具体的实施目标,在给产业界各方带来

动力和信心的同时,更是宣告我国IPv6产业迈人了一个全新的全面服务时代

P6是数字化时代的网络基石,此次升级行动规格如此之高,不仅是因为

IPv6的商业价值,更是因为IPv6将成为新技术革命和新产业升级的重要基石。

相比IPv4来说,Pv6有三大优势可以为即将到来的数字化社会奠定基石。

001

(1)近乎无限的地址数量将赋予每一个物体以专署P地址。Pv4的地址数量

极限为43亿个,无法为地球上的每人分配一个,而IPv6地址可以理解为是无穷

IPv6

的,用个形象的比喻就是连地球上的每一粒沙子都能分配一个Pv6地址。

(2)面对海量连接管理更加方便。由于地址足够充足,因此不再需要人工配

置或者动态主机配置协议(DHCP)这类地址分配服务,同样的道理,也无须网络

地址转换(NAT)这样的地址转译。可以说,IPv6节省了很多复杂的IP设计,让

网络层次进一步扁平化。

(3)为不同的应用场景提供了更好的移动特性。相比IPv4,IPv6提供了嵌入

在网络设备中,支持互操作和移动的能力,这对万物智联时代不同场景的智能硬

件应用而言至关重要。

加速P6升级部署的最好方式是与其他网络技术进行有效的协作融合。区

块链技术是一种打破传统互联网中心化特征的分布式网络平台,它更像是一个人

002

人都能记录、查看和维护的公用账簿,任何记录都有永久的时间标记,无法篡改,如此重建信任机制。基于区块链的技术机制,确保了每个参与者的诚信行为,让信任在区块链平台上得以良好的维持。在分布式网络的技术支撑下,Pv6会在区块链领域取得突破性进展。未来,IPv6将与区块链、SDN/NFV、5G网络等新技术融合,爆发出新的生命力。

随着互联网用户和数据量的急剧增长,用来提供数据集中存储和计算能力的服务器已不堪重负,而以视频为主的多媒体数据服务以及大型文件传输的流行更突显了这一问题。为解决此类问题,分布式网络技术应运而生。有别于传统的客户端/服务器(模式)(Client//Server,简称“C/S模式网络”),分布式网络中的每个节点在行为上是自由的,在功能上是平等的,在连接上是互联的,所有节点分布式地组成一个整体网络。因此,它能够极大地提高网络效率,充分利用网络带

宽,开发每个网络节点的潜力。C/S结构和分布式网络结构(P2P结构)的对比如

图0-1所示。

文件服务器

客户机

(a)CS结构

(b)P2P结构

图0-1C/S和分布式网络结构(P2P结构)的对比

通过这种对等的服务,服务器的作用被淡化和减弱了,节点间通过分布、对等的算法实现协作和共享,所有数据可以分布存储在分布式网络内的各个节点上,网络的资源被最大化利用,整个网络的负载也可以达到均衡。

分布式网络应用的发展如火如茶、势不可挡。自1999年起,随着共享工具

Napster的出现,分布式网络应用在短短几年之内就迅速发展并占领了多个网络应用领域。以Napster、BitTorrent、eDonkey、KaZaA为代表的文件共享应用,凭借自由开放的资源共享方式、高速的用户下载体验迅速成为主流的下载工具。以

Skype为代表的网络电话(VoIP)应用凭借流畅清晰的通话质量、低廉的通话费用使网络电话迅速普及,对电信业务构成了强有力的冲击。以PPLive、QQ直播、PPStream为代表的流媒体应用凭借清晰流畅的播放体验、丰富多彩的节目内容使网络电视摆脱了带宽瓶颈,成为视频、电视节目、电影等多媒体资源新的发布平台。

P2P技术又称“对等互联网络技术”,是一种网络新技术。目前,P2P技术将

与新型网络技术融合,爆发出新的生命力。Ulod是一个基于区块链技术构建的分布式P2P网络开源项目,这句话是对Ulod所使用技术的经典描述。Ulord有别于其他区块链项目,它是颠覆性技术(区块链技术)与传统技术(分布式网络技术)的完美结合,这也是让人眼前一亮的地方。

P2P通信在未来将是一种非常重要的通信方式,以网页实时通信(WebRTC)

为代表的P2P通信将深刻影响人们的日常通信方式。

中国的5G网络有望在2020年正式商用,届时移动端网络的状况将大幅提

高,P2P通信的质量将大幅提高,将是P2P通信应用的大繁荣时期。中国基于

WebRTC做实时通信云PaaS(平台即服务)的厂商不胜枚举。野狗、声网等厂商已经打造出了成熟的WebRTC通信云平台,其中野狗通信云是国内第一家P2P通信免费的厂商。企业对实时视频的需求量大。社交、在线教育、金融、客服等都需要实时视频来给用户提供更好的实时互动服务。智能手机、电脑等硬件设备的性能不断提升,为P2P通信提供了良好的硬件基础。Google(谷歌)、Apple(苹果)等大厂商对WebRTC的更新和适配加速了WebRTC的普及,间接推进了P2P通信的普及。

P2P技术的广泛应用也深刻影响了传统搜索技术,基于P2P的搜索系统大量

出现。P2P网络中的用户可以选择将本地的资源共享到网络,用户搜索时不通过

中心服务器,节点间可以相互搜索。因此,P2P搜索的效率与传统搜索系统相比

具有很大优势,P2P搜索的范围可以在短时间内以几何级数增长。同时,P2P搜

003

索技术在搜索到的信息的及时性、有效性等方面也有很大优势,并且能更快地定

位下载资源,缓解人们从搜索资源到下载资源之间的矛盾。随着5G、物联网、云

服务的加入,万物互联时代即将到来,海量连接数据的精准搜索定位将是一个研究课题。

P2P应用已经是当今互联网上最广泛的应用之一。但P2P应用很多是基于

IPv4网络,在Pv6网络上的应用仍存在制约其发展的障碍。其中,主要的障碍就

是P2P系统的封闭及无标准性。另外,许多P2P系统虽然在拓扑结构上属于P2P

结构,但许多关键服务是通过服务器来完成的。作为具有颠覆性的新一代网络技

术,区块链在许多行业的应用层出不穷。Pν6除了作为区块链的底层协议之外,

与区块链结合将在安全性方面发挥巨大的效果。Pν6通过地址的管理和路由机制,

使P层的溯源与可信验证成为可能。区块链技术去中心化的信任传递机制将为网

络空间的发展注入强大的动力,在安全性上解决了信任的问题。二者结合,将极

004

大地提高信息的可信性与真实性。大部分分布式网络应用都有相应的网络模型支撑,但特定的分布式网络模型因自身的局限性而只适合特定的分布式网络应用,尤其对Pv6网络。因此,需要寻求更为通用的适用于IPv6的分布式网络模型,如

何进一步提高基于P6的分布式网络的路由效率,降低网络带宽占用,提高网络

的可扩展性,提高海量数据的搜索性能以及增强网络流量检测的精准度,都是非常值得研究的问题。

0.2国内外研究现状

分布式网络模型研究是分布式网络技术研究中的一个重要组成部分。网络模型的研究旨在为解决分布式网络的可扩展性、负载以及管理等方面的问题,提供可实现的方案。迄今为止,分布式网络技术研究已经取得了长足的发展,分布式网络模型也已经过了几代的更新,根据拓扑结构的不同,可以将分布式网络模型分为以下四种。

第一,中心化拓扑网络模型中存在中央索引服务器,用来存储资源的索引信息,资源的发现依赖该索引系统,而数据资源在对等节点间直接传递。第一代MP3共享软件Napster是一个中心化拓扑网络的典型应用。中心化结构最大的优点是维护简单,发现效率高。资源的发现依赖中心化的目录系统,发现算法灵活高效并能够实现复杂查询。最大的问题与传统客户机/服务器结构类似,容易造成单点故障、访问的“热点”现象和版权纠纷等相关问题。

第二,非结构化拓扑网络模型主要采用随机图的组织方式,没有中心服务器,

各节点完全平等。各节点间采用TTL(Time-to-Live)广播洪泛(Flooding)、随机漫步或有选择地转发算法等机制建立通信,提供资源发现方法,典型的应用有

Gnutella(努特拉)和Freenet(自由网)。网络中的节点度数服从幂律(Power-law)分布规律,能够较快地发现目的节点,在面对网络的动态变化时,体现了较好的稳定性和容错能力,因此具有较好的可用性。同时,可以支持复杂查询,如带有规则表达式的多关键词查询、模糊查询等。

由于没有确定拓扑结构的支持,非结构化网络无法保证资源发现的效率,其扩展性较差,即使需要查找的目的节点存在,发现也有可能失败。由于采用洪泛等方式作为查找算法,在查找的过程中网络的负载很重,可能一个查询请求会被发放到整个网络,造成网络资源的很大浪费,并且可能产生网络的广播风暴,造成网络瘫痪。

第三,以基于分布式哈希表(DHT)的定位和路由机制为核心的分布式网

络结构化拓扑网络模型是最新的研究热点。这种网络系统能够自适应节点的动态

加入/退出,有着良好的可扩展性、健壮性、负载均衡性和自组织能力。DHT使

用分布式哈希算法来解决结构化的分布式存储问题。分布式哈希算法的核心思想是将存储对象的特征(关键字)进行哈希运算,得到键值,对象的分布存储依据键值来进行。采用DHT的分布式网络路由协议主要有Chord、CAN、Pastry、

Tapestry。由于采用了确定性拓扑结构,DHT可以提供精确的发现。只要目的节点

存在于网络中,DHT总能发现它,发现的准确性得到了保证,而且在每个节点维

护少量的路由信息的情况下,资源可以在有限的步骤内被定位到。以Chord协议为例,N个节点的分布式网络中每个节点只需要维护O(1gN)项路由信息,即可在O(1ogN)跳内定位到资源。目前,基于它们的应用主要集中在数据和文件共享系统上,主要有协作文件系统(Cooperative File System,CFS)、PAST、分布式存储系统(OceanStore)。DHT结构最大的问题是维护机制较为复杂,尤其是节

点频繁加入、退出造成的网络波动会极大地增加DHT的维护代价,从而影响其稳

定性。

第四,如今网络上流行的分布式网络应用系统主要还是基于前两种拓扑结构,或结合这两种结构而形成的混合分布式网络,风靡全球的文件共享软件

KaZaA、BitTorrent、语音通信软件Skype,以及国内流行的分布式网络流媒体自播软件PPLive,都是混合分布式网络的应用。面对纷繁复杂的网络环境,混合分

布式网络能结合两种结构的优点,很好地适应环境,并可以根据具体环境适时调

整部分结构。该结构的特点是在性能、可控性、扩展性方面都达到了一种折中。

005

Considine(2002)提出了基于DHT的群组(Cluster)概念,在DHT结构网络上

把通信延时较短的节点分类组合成一个个群组,节点间的查找和通信可以通过该IPv6

群组建立快速通信,DHT的查询性能得以提高。Ganesan等(2004)给出了一种

层次化树形的分布式网络结构设计,把很多个小的DHT网络组织成多层的树状网

络,从外面看来是这些小的DHT网络合并而成的一个大的DHT网络,有节点的

式网

层次化控制及网络节点的组织适应底层物理网络等优点。

以上所介绍的各种网络模型都有针对性地解决了分布式网络技术中某几方面

的问题,但同时也存在其无法避免的先天缺陷。分布式网络技术的不断发展以及

网络用户呈几何级数的增加,对当前的Internet架构产生了巨大的冲击,各种网络

模型中存在的问题已经成为阻碍分布式网络技术进一步发展的一个障碍。分布式

网络技术中主要存在以下问题:

第一,网络模型的构造与可扩展性。

006

可扩展性问题一直以来都是困扰分布式网络研究人员的大问题。在典型模型中,无论是集中式路由网络模型还是非结构化路由网络模型,都受到了严重的困扰。以目前应用最广泛的Gnutella网络模型为例,Gnutella网络中的节点在搜寻数据时是以洪泛的方式将消息散布在网络上的,这会造成消息泛滥的问题,也使系统的可扩展性无法提升,并加重了网络的负荷。

结构化网络模型采用规则结构化的拓扑设计虽然在一定程度上解决了分布式网络的可扩展性问题,但同时也出现了新的问题:由于采用的是单向定位机制,所以支持的是精确匹配查询,当该机制用于文件共享等存在标识模糊性的网络中时,上述单向定位机制缺乏可选择性的弱点就暴露出来,精确匹配的限制导致结果唯一或结果集偏小(在存在多个同名副本的情况下)。此外,在Chord型的网络模型中,由于其查询机制带来了匿名性较弱的问题,所以,可扩展性所带来的问题并没有完全在结构化网络模型中得以解决。

第二,分布式网络模型中覆盖层网络与底层网络物理拓扑结构的差异问题。同样,以Gnutella为例说明这个问题。在Gnutella路由网络模型中,经常会出现一条Gnutella消息多次在同一条链路上反复传递的情况,从而导致网络路由的效率低下,造成大量不必要的带宽损耗。这种情况产生的根本原因是Gnutella网络逻辑拓扑结构和网络底层实际拓扑结构存在严重的差异性。同样的问题也存在于其他的路由网络模型中。比如,结构化路由网络模型Chord中的绕路(Detouring)问题,就是由于该系统通过哈希算法所设计的映射方法,导致了在哈希环域中非常邻近的两个节点却有可能在实际网络拓扑中相距很远,而在实际网络中相距很远的节点经过哈希算法映射却可能成为哈希环中非常邻近的两点,从而导致路由效率的低下。

···试读结束···

阅读剩余
THE END