基于网页差异的网页分析方法及系统
基本信息
申请号 | CN201510917292.X | 申请日 | - |
公开(公告)号 | CN105512296A | 公开(公告)日 | 2016-04-20 |
申请公布号 | CN105512296A | 申请公布日 | 2016-04-20 |
分类号 | G06F17/30(2006.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 冯建兴;张云刚;翁时锋;梁丰;王遵义 | 申请(专利权)人 | 宁波中青华云新媒体科技有限公司 |
代理机构 | 上海唯源专利代理有限公司 | 代理人 | 宁波中青华云新媒体科技有限公司 |
地址 | 315199 浙江省宁波市鄞州区泰康中路666号迪趣大厦8楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种基于网页差异的网页分析方法及系统,其方法包括:采集需要分析的网页信息;根据采集的所述网页信息的节点结构,对所述网页信息进行聚类;根据所述聚类结果,提取出每一个节点中,节点内容变动的可视化网页元素;对提取出的可视化网页元素进行分类,以对所述可视化网页元素进行识别。本发明可以自动化地实现对网页内容的分析,无需人工操作,且通过提取可视化的变动网页元素,实现了针对用户关心的核心网页信息的分析,具有针对性强,分析效果好,节约了人力成本,效率高、解析能力强、通用性强的优点。 |
