一种基于相似度估计的分布式PageRank加速方法

基本信息

申请号 CN201711481710.0 申请日 -
公开(公告)号 CN110020087B 公开(公告)日 2021-11-09
申请公布号 CN110020087B 申请公布日 2021-11-09
分类号 G06F16/953 分类 计算;推算;计数;
发明人 尤佳莉;张欣;薛寒星;刘学 申请(专利权)人 北京中科视云科技有限公司
代理机构 北京方安思达知识产权代理有限公司 代理人 陈琳琳;武玥
地址 100190 北京市海淀区北四环西路21号
法律状态 -

摘要

摘要 本发明提供了一种基于相似度估计的分布式PageRank加速方法,所述方法包括:步骤1)以网络中的每个节点作为中心节点,构建中心节点与网络临近节点之间连接关系的子图;每个子图计算代表自身后继元集信息的特征向量;步骤2)当前子图计算相遇对象的后继元集和自身顶点集的相似度,根据预设阈值,决定是否将相遇对象的ID加入自身的候选列表;步骤3)当前子图将相遇对象的候选列表中子图加入自身候选列表,相遇对象将当前子图的候选列表中子图加入自身候选列表;步骤4)计算当前子图的顶点集与所有候选对象的后继元集的相似度,取相似度最大的作为下次正式相遇的对象;步骤5)根据相遇时两个子图之间的交互操作,计算并更新当前子图中所有的PageRank值。