针对网页变化的自动回归检测与块匹配自适应方法和装置
基本信息
申请号 | CN201811124012.X | 申请日 | - |
公开(公告)号 | CN109344355B | 公开(公告)日 | 2022-03-15 |
申请公布号 | CN109344355B | 申请公布日 | 2022-03-15 |
分类号 | G06F16/958(2019.01)I;G06F8/71(2018.01)I | 分类 | 计算;推算;计数; |
发明人 | 张颖;杨威;徐经纬;苏星;黄罡 | 申请(专利权)人 | 因特睿科技有限公司 |
代理机构 | 北京中济纬天专利代理有限公司 | 代理人 | 江黎 |
地址 | 100080北京市海淀区北四环西路65号1626室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种针对网页变化的自动回归检测与块匹配的自适应方法及装置,能够动态地检测目标网页变化,并给出修改建议。所述针对网页变化的自动回归检测与块匹配的自适应方法的特征在于包括如下步骤:检测网页变化,用于检测新旧目标系统的网页是否发生变化并给出报告;进行内容块匹配,接收检测到变化的报告后对网页进行分析,找出新目标系统的网页与旧目标系统的网页对应的内容块部分,内容块匹配包括:文字分析步骤,获得语义信息与文字区域;图形界面分析步骤,获得图形区域;映射步骤,对以上获得的语义信息、文字区域和图形区域进行相似度匹配,然后基于对应的内容块部分的变化,给出针对现有网页数据提取系统工具的代码修改建议。 |
