下载此文档

基于人工免疫的p2p文件共享防污染系统.docx


文档分类:行业资料 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
该【基于人工免疫的p2p文件共享防污染系统 】是由【zhangkuan1436】上传分享,文档一共【11】页,该文档可以免费在线阅读,需要了解更多关于【基于人工免疫的p2p文件共享防污染系统 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于人工免疫的P2P文件共享防污染系统
摘要:文文件污染是是当前P22P文件共共享系统普普遍存在的的问题,极极大的降低低了系统的的可用性。P2P文件共享系统和生物免疫系统一样,都是高度分布、自适应和自组织的。利用向量空间相似度赋予投票权重,采用自适应的信誉阈值判断文件可信性,建立了基于人工免疫的防污染对象信誉机制来进行邻居节点集的选取,以改进系统可用性。仿真实验表明,系统具有很高的识别精确度,能够以低通讯代价很好的抑制污染文件在网络中的传播。
关键词:污污染;人工工免疫系统统;可用性性;文件共共享;P22P
引言
目前,P22P文件共共享已经成成为Intterneet上的主主要应用之之一,对IInterrnet的的使用和流流量产生了了巨大的影响。PP2P网络络具有很多多优良特性性,但是它它的分布性性、开放性性和自治性性使它不可可避免的遭遭遇安全问题题的挑战,比比如P2PP文件共享享系统中的的文件污染染问题。
所谓文件污污染问题,是是指在P2P文件件共享系统统中,恶意意用户发布布与所标示示主题不相相符合的文件内内容,并通通过P2PP文件共享享进行传播播。文件污污染问题给给P2P文文件共享系系统造成了了很大的危危害:首先,如果果用户频繁繁遭遇污染染文件,其其感受到的的可用性会会急剧降低低,甚至最最终放弃使使用该系统;而且且,它为病病毒、蠕虫虫等恶意程程序的传播播提供了便便利,造成成了网络安安全上的隐隐患。
对P2P网网络的实际际测量数据据表明,现现实存在的的文件污染染现象十分分普遍,尤尤其是对于于最近流行行的内容。在在FasttTracck/KaaZaA、eeDonkkey、OOvernnet等PP2P系统统中,有半半数流行内内容的拷贝贝是被污染染的或是伪伪造的[11][2]]。
作为一个高高度进化的的复杂系统,生物物免疫系统统能够区分分外部有害害物质和自身身组织,从从而清除病病原并保持持有机体的的稳定。从从计算的角角度来看,生生物免疫系系统具有高度分布、自自适应和自自组织的特特性,具备很强的学学****识别别、记忆和和特征提取取能力。受受到生物免疫疫系统的启发,人们们提出了人人工免疫系系统(ArtiificiialIImmunneSyystemm,AIIS)的概念[33]。由于它提供供了一种强强大的信息息处理和问问题求解范
范式,近年年来,基于于免疫系统统原理的各各种模型和和算法已经经被广泛的应用在信信息安全[[4]、模模式识别[[5]、数数据挖掘[[6]、智智能优化[[7]等研究领域中。
与生物免疫疫系统一样,P2PP文件共享享系统也具具有高度分分布、自适适应和自组组织等特性性。在P22P文件共共享系统中中,通过建立基于人人工免疫原原理的对象象信誉机制制,使用人人工免疫方方法进行邻居节点的的选择过程程,对候选的的节点使用用人工免疫疫算法进行行筛选,选选取出和本本节点具有有较高投票相似度度的邻居节节点,可以以减少恶意意节点传播播污染文件件的可能性性,避免恶恶意节点的的共谋攻击击,从而提高文文件共享系系统的可用用性。
本文以下部部分的结构构为:第一部分介绍相相关研究工工作,第二部分描述对对象信誉机制,第三部分提出基基于人工免免疫原理的的邻居选择择算法,第四部分进行仿仿真实验分分析,最后总结结本文并展展望下一步步工作。
相关研究工工作
抑制文件污污染的方法法有很多[[8],比如基基于原始文文件的方法法、基于专专家意见的的方法、基基于简单投投票的方法法、基于信信任关系的的方法等。
在基于简单单投票方法法的基础上上,通过对对历史行为为的分析,某某些专家节节点被认为为比其它节节点更为可可信,于是是它们的投投票就被赋赋予较大的的权重,使使用一个信信誉系统来来保存、更更新和传播播这些权重重,然后结结合投票来来对文件的的可信性进进行评估。CCredeence系系统[9]采用基于于对象信誉誉的方法,节节点通过ggossiip过程收收集其它节节点的投票票,使用PPearsson相关关相似系数数作为节点点投票相似似度的衡量量标准,赋赋予其它节节点的投票票以权重,并并对所收集集的投票进进行二次抽抽样。由于于采用goossipp过程,需需要对投票票逐一进行行加密和解解密验证,带带来了很大大开销,而而且没有解解决freeeloaadingg问题,也也没有考虑虑到邻居节节点的选取取。
XRep[[10]和X2Rep[11]系统都引引入了对象象信誉,并并依据过去去的投票行行为赋予节节点以权重重,但是都都没有在节节点之间共共享信誉信信息,并且且要求节点点在评价阶阶段在线进进行投票的的计算和传传播,不适适合动态的的P2P环环境。
在KaZaaA[12]系统中,节节点对自己己所共享的的文件给出出评分,表表示为四个个级别的真真实度。但但是,系统统是根据节节点自己对对所共享文文件的评分分来决定文文件的信誉誉值,没有有节点之间间相互评分分的机制,使使信誉系统统容易受到到恶意节点点的攻击。
eMulee和eDoonkeyy网络通过过Jugllereeal-ttimeFakeeChecck服务[[13]来抑制文文件污染,
但但是很容易易受到暂时时副本诱骗骗的攻击。
在查询的返返回结果中中选取下载载地址时,有有的系统采采用选取最最佳返回结结果的策略略,容易受受到恶意节节点的欺骗骗攻击。于于是,很多多系统采用用随机选取取返回结果果的策略来来抑制污染染的传播,能能够使可信信文件的搜搜索结果随随攻击者数数目的增加加呈线性下下降,但是是在污染程程度很低的的时候,却却造成较大大的性能损损失[14]。
大多数推荐荐系统中采采用了相关关的协同过过滤技术,但但是它们依依赖于集中中式的控制制,不合适适于具有分分布特性的的P2P系系统。
对象信誉机机制
在P2P文文件共享网网络上,建立基于于对象的信信誉机制,从而而抵御文件件污染。这里的对对象信誉,是是指系统中中所共享的的文件对象象的可信程程度。
在网络中的的每个节点点上存储两个哈哈希表,一一个是投票票箱(BaallottBoxx),一个个是相似度度表(SiimilaarityyTabble)。投投票箱中的的每一项对对应着对某某个文件的的投票集,是是一个子哈哈希表,子子哈希表中中的每一项项则对应着着某个节点点对该文件件的投票。相相似度表的的每一项对对应着本节节点与某个个节点的投投票相似度度,相似度度值在[--1,1]]之间,显显然,每个个节点与自自身的相似似度为1..0。

每个节点开开始共享自自己的文件件时,对自自己的每个个文件进行行投票。由由于对文件件受污染与与否的判断断结论是确确定性的,不不需要采用用多等级的的评定标准准,同时为为了能够表表达中性的的意见,采采用最简单单的奇数等等级值,将将评分分为为{-1,,0,+11}三个等等级,其中中,-1表表示用户认认为该文件件为污染文文件,+11表示用户户认为该文文件为可信信文件,00表示用户户没有进行行评价。
恶意节点为为了使污染染文件能够够得到广泛泛的传播,会会将对污染染文件的投投票值也设设为+1。

查询消息可可以被用来来触发节点点传播投票票,在节点点进行搜索索的过程中中,收到查查询的节点点除了要完完成转发处处理的任务务,如果它它对这个文文件有投票票,还要返返回自己的的投票给发发起查询的的节点,假假设底层PP2P网络络的路由传传输是安全全可靠的,恶恶意节点不不能够任意意操控网络络上传输的的消息,所所以发起查查询的节点点能够保证证得到的这这个投票
是是真实的。这这个节点将将收集到的的投票加入入投票箱中中,然后进进行相似度度表的更新新过程。

在传统的人人工免疫系系统模型里里,抗体和和抗原的亲亲和力,一一般是采用用简单的EEucliideann距离、Maanhatttan距距离或Hammming距距离等字符符串距离或向量量距离来表示的。
在这里的对对象信誉机机制中,节点的的投票相似似度就是匹匹配特异性性。对投票票箱中存在在投票的每每个文件,统统计本节点点和待评估估节点的投投票,计算算两者的相相似度,并并记入相似似度表中。
相似度的计计算,一般般有相似距距离和相似似系数两类类衡量方法法,相比而而言,后者者更为精确确的反映了了数据之间间的相似程程度,其中中包括Peearsoon相关相相似系数、指指数相似系系数、向量量空间相似似系数等多多种衡量标标准。
这里采用以以向量夹角角余弦表示示的向量空空间相似系系数作为衡衡量标准来来计算节点点投票之间间的相似度度。
(1)
节点投票构构成了K维维文件对象象空间上的的向量,如如果节点没没有对某个个文件进行行评价,则则相应分量量为0。设设节点nii和节点nnj在K维文文件对象空空间上的投投票值分别别表示为KK维向量和和,则节点点ni和节点nnj之间的投投票相似度度为:
其中,节点点ni和nj共同投票票的文件集集合用Iiij表示,节节点ni和nj投票的文文件集合分分别用Iii和Ij表示,VVi,k和VVj,k分别别表示节点点ni和nj对文件kk的投票值值。

更新相似度度表之后,在在投票箱中中查询对该该文件的投投票,在相相似度表中中查询相应应投票节点点与本节点点的相似度度,将投票票值与相似似度的乘积积累加得到到文件的信信誉值esstimaate。当当estiimatee超过某个个阈值acccepttThreesholld时,接接受这个文文件;当eestimmate低低于某个阈阈值rejjectTThressholdd时,拒绝绝这个文件件;介于两两者之间,则则以概率接接受这个文文件。
一般来说,判判断文件是是否污染的的信誉阈值值有三种取取值方案::全局阈值值、多数
阈阈值、本地地阈值。全全局阈值方方案由全局局共享一个个固定的值值,不能够够灵活取值值;多数阈阈值方案由由局部的大大多数节点点共同决定定一个值,存存在节点之之间相互信信任的问题题。所以采用本本地阈值方方案,并且且引入自适适应的阈值值取值方案案。
G(t)和和P(t))分别表示示在时刻tt,系统中可可信文件和和污染文件件的数目,则表示污染染文件所占占的比例,也就是污污染文件的的扩散程度度。用户感知知污染率表表示用户在在下载过程程中遭遇污污染文件的的概率,h(t))和污染文文件的扩散散程度相关关,表示相关关程度的θθ(•)是单调调增函数。
α表示节点点采用对象象信誉机制制时在处理理一个可信信文件时接接受它的概概率,β表示节点点采用对象象信誉机制制时在处理理一个污染染文件时拒拒绝它的概概率。显然,α和β的值越接接近1,系统的精精确度越高高。
(2)
在引入对象象信誉机制制之后,用户感知知污染率由由原来的hh(t)变变为:
H(t)的的值用户可可以通过统统计得到。用户对衡衡量系统精精确度的指指标α和β的值并不不知情,只只能通过统统计得到的的用户感知知污染率HH(t)来来评判当前前的系统性性能。
当H(t))超过用户户预期的值值H时,同同时提高aaccepptThrreshoold和rrejecctThrreshoold的值值;当H((t)低于于某个很小小的值ε时,同时时降低acccepttThreesholld和reejecttThreesholld的值。采采用自适应应的阈值取取值方案,使使得系统在在网络动态态变化的情情况下,仍仍然能够保保持α和β的值同时时处于较高高水平。
邻居选择算算法
通过不断调调整P2PP文件共享享系统ovverlaay网络的的拓扑结构构,可以增强普普通节点的的集聚性,而而对恶意节节点进行有有效的屏蔽蔽,从而减减少恶意节节点传播污污染文件的的可能,提提高文件共共享系统的的可用性。由由于P2PP网络的分分布性特点点,从单个个节点的角角度来看,可可以采用有有效的邻居居选择算法法,以达到这个个目的。
为了能够在在网络节点点中找到一一个子集,作作为自己的的邻居节点点,节点需要要采用一种种有效的邻邻居选择算算法,如果果仅仅选取与自身相似似度最高的的k个节点作作为邻居,这样做并不能够选取出最具有潜力的良好节点来防止文件污染,而且容易遭到共谋攻击的威胁。
生物免疫系系统具有高高度分布、自自适应和自自组织的特特性。通过过模仿自然然生物免疫,建立立人工免疫疫系统来进行节点点的邻居选选择过程,对对候选的节节点使用人人工免疫算算法进行筛筛选,选取取出和本节节点具有高高相似度的的邻居节点点,同时,保持持邻居节点点的多样性性,从而使系统统达到很高高的集聚性。
算法的伪代代码如下所所示:
(1) AAIS系统统初始化;
(2) 将将本地的投票信息编码为为抗原Agg;
(3) WWHILEE还有候选选节点存在在
(4) 加入下一一个候选节节点;
(5) 将其投票票信息编码码为抗体Ab;
(6) 计算Agg与Ab的投投票相似度度;
(7) 计算Abb与其它抗体体的投票相相似度;
(8) WHILLE邻居居节点集合合未满
(9) 执行浓度更更新过程;;
(10)EENDWWHILEE
(11) ENDWHILLE
其中,浓浓度更新过过程的算法法伪代码如如下所示::
(1) 根根据Ab与Ag的相似似度提高AAb的浓度度;
(2)根据据Ab与其它它抗体的相相似度降低低Ab的浓浓度;
(3) 根根据自然衰衰减常数降降低Ab的的浓度;
(4) IIFAbb的浓度大大于某个阈阈值
(5) 将Ab加入入到邻居集合合中;
(6) EELSE
(7) 将Ab清除除出候选集集合;
根据算法所所描述的抗抗体浓度更更新过程,得得到抗体AAb的浓度度变化满足足以下微分方方程式:
其中,xii表示抗体体Ab的浓浓度,y表表示抗原AAg的浓度度,xj表示其它它抗体的浓浓度,N是是其它抗体体的个数,kk1、k2、k3是相应的的常数参数数。方程式式中的第一一项表示抗抗体Ab的的抗原刺激激,它的强强度与Abb和Ag的相似似度mi成正比,第第二项表示示抗体被其其它抗体识识别时所受受到的抑制制,它的强强度与Abb和其它抗抗体的相似似度mijj成正比,第第三项表示示抗体细胞胞没有受到到刺激而自自然衰亡的的过程。
仿真实验分分析

通过在开源源的P2PP模拟器NNeurooGriddSimmulattor[15]的基础上上加入文件件共享功能能,使得被搜搜索到的文文件能够在在网络中复复制传播,然后根据据前面描述述的节点投投票算法和和人工免疫疫算法,实现基于人人工免疫的的对象信誉誉机制模块,来验证该该机制抑制PP2P系统统中文件污污染的能力力。
实验场景为为模拟一个个具有10000个节节点和100000个个初始文件件对象(GG(0)++P(0))=100000)的的P2P文文件共享网网络,网络拓扑扑结构符合合参数为((,,)的Poower--law分分布,节点上的的文件分布布和文件中中的关键字字分布都符符合Zippf分布规规律。网络中查查询消息的的TTL设设为7,平均每个个节点每天天发起100次搜索,模拟进行行10天((t=100)共发生生1000000次搜搜索。另外,系系统中设置θ(x)==x,即用户户感知污染染率h(tt)与污染染文件的扩扩散程度pp(t)相相同。
节点角色分分为三种::良好节点点(BennignPeerr)、恶意意节点(AAdverrsariialPPeer))、搭便车车节点(FFreerridinngPeeer)。三种所占占比例设为为:BENNIGN__RATEE=800%,ADDVERSSARY__RATEE=10%%,FREEERIDIING_RRATE==10%。

很多P2PP客户端将将查询的结结果按照所所发现的文文件拷贝数数降序排列列,这就产生生了马太效效应,用户更愿愿意选择拷拷贝数多的的文件进行行下载,而这又进进一步增加加了其拷
贝贝数。所以系统统初始状态态对整个系系统的精确确度性能表表现影响很很大。在对比系系统精确度度时,设置两组参数:POLLLUTIOON_RAATE分别别为10%%和50%,模模拟低污染染率和高污污染率两种种环境,其它实验验中,设置PPOLLUUTIONN_RATTE为高污污染率条件件,即500%。
图1低低污染率下下对象识别别的精确度度图图2高高污染率下下对象识别别的精确度度
由实验结果果图1和图图2可见,在各种污污染程度下下,系统的精精确度β值(BennignPPeerss’Betta)都能能够达到990%以上上,对搭便车车节点的惩惩罚(Frreeriiderss’Betta)也随着污染染程度的增增加而变得得更为严厉。在图1的的低污染率率条件下,搭便车节点利用系统所获得的识别精确度非常接近于良好节点;而在图2的高污染率条件下,搭便车节点利用系统所获得的识别精确度大大降低,搭便车节点几乎不能够从对象信誉机制中得到益处。
从图3可以以看到可信信文件与污污染文件传传播速度的的对比,可可信文件在在系统中持持续增长,而而污染文件件只是略有有增加,两两者的差距距越来越悬悬殊,污染染文件的传传播受到了了很大的抑抑制。

由于网络带带宽和节点点计算能力力的限制,节点进行行投票收集集的范围是是受限的,同时,人人工免疫系系统还处在在初始阶段段,因此系系统在启动动初期由于于节点之间间没有充分分的共享投投票信息,所以处于于不稳定的的状态,对象识别别的精确度度有一个收收敛过程。通过实验验结果图11和图2可可以看出,该系统具具有较短的的学****曲线线,虽然在初初始启动阶阶段(小于于Day22时)处于于不稳定的的抖动状态态,但能够够在较短时间内内(在Daay2附近近)达到并并保持稳定定状态。
采用带有有有效期的路路径缓存机机制或是受受控的更新新传播方案案可以带来来收敛速度度和性能的的进一步改改善。

对象信誉机机制的引入入会带来额额外的开销销,由于应用用范围是文文件共享系系统,所以主要关关注的性能能指标是通通信开销。
从图4可以以看到,额外的投投票通信开开销与搜索索本身产生生的开销相相比起来很很小(%-0..11%),不会加重网络的负载。
图3可可信文件与与污染文件件的传播图4对象信誉誉机制通信开开销
结论与展望望
在P2P文文件共享系系统中,建建立了基于人工工免疫原理理的对象信信誉机制,使使用人工免免疫算法从从候选节点点中选取出和和本节点具具有较高投投票相似度度的节点作作为邻居节节点。在该该系统中,通通过计算节节点之间投投票向量的的夹角余弦弦来衡量节节点投票的的相似性,并并以此赋予予投票权重重,在判断断文件可信信性时运用用自适应的的信誉阈值值。该系统统以较低的的开销有效效的抑制了了污染文件件在文件共共享网络中中的传播扩扩散,避免免了恶意节点点的共谋攻攻击,提高高了P2PP文件共享享系统的可可用性。
在下一步的的工作中,希望建立立动态自适应应的邻居选选择算法以以进一步优化化拓扑结构构;利用文件件的流行度度信息,针对易受受污染的热热门文件进进行投票,以降低系系统开销;;另外,研究如何何利用兴趣趣类聚提高高网络的集集聚度也是是下一步的的工作。
参考文献::
,,,,,Miammi,FL,USAA,Marrch22005..
,,,,--SharringSysttems..ProceeedinngsoofIEEEEIInfoccom22006,,Barrceloona,Spaiin,AAprill20006.
DasguuptaD,AAttohh-:,Man,,anddCybberneeticss,Orrlanddo,Flooridaa,~~374.
KimJJ,BeentleeyP..Towwardssanartiificiialiimmunnesyystemmforrnettworkkinttrusiionddetecctionn:,Seeoul,,Korrea,~30..
,,20000,77(3)::28~441.
TimmiisJ,,NeaalM..,,20001,114(3--4):1121~1130.
ChunJS,,LimmJPP,,,19999,114(3)):6100~6155.
NeilDaswwani,,HecctorGarccia-Moliina,-SShariingPPeer--to-PPeerSysttems..Prooceeddingssofthe9thInteernattionaalCoonferrenceeonDataabaseeTheeory,,Jannuaryy08--10,~115.
,,-tto-,SaanJoose,USA,May20066.
,,***hi,-BaasedApprroachhforrChooosinngReeliabbleRResouurcessinPeerr-to--,Wasshinggton,,DC,USAA,Octtoberr20002.
,R..Saffavi--Nainni,W..Sussilo..X2Rep::EnhhanceedTrrustSemaanticcsfoorthheXRRepPProtoocol..ProoceeddingssofApplliedCrypptogrraphyyanddNettworkkSeccuritty,YelllowMMounttain,,Chiina,Junee20004.

基于人工免疫的p2p文件共享防污染系统 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人zhangkuan1436
  • 文件大小197 KB
  • 时间2022-10-23