一种页面元素分类方法、解析器、介质及设备

基本信息

申请号 CN202110378864.7 申请日 -
公开(公告)号 CN113065600A 公开(公告)日 2021-07-02
申请公布号 CN113065600A 申请公布日 2021-07-02
分类号 G06K9/62;G06F8/20 分类 计算;推算;计数;
发明人 游海涛;梁兴通;王琳;杨丰佳 申请(专利权)人 易联众信息技术股份有限公司
代理机构 厦门加减专利代理事务所(普通合伙) 代理人 李强;杨泽奇
地址 361008 福建省厦门市软件园二期观日路18号502室
法律状态 -

摘要

摘要 本发明涉及页面元素分类技术领域,特别涉及一种页面元素分类方法、解析器、介质及设备,其中,一种页面元素分类方法,包括提取已知页面元素并分类,对已分类的所述已知页面元素进行元素特征提取;建立逻辑回归模型,对所述逻辑回归模型进行分类训练;根据训练完成的所述逻辑回归模型,对页面文件上的页面元素进行分类;先通过已知页面元素的分类及元素特征的提取,以便对逻辑回归模型进行分类训练,再利用训练完成的逻辑回归模型对页面文件上的页面元素进行分类,提升了页面元素分类的准确率,使分类更贴近于页面元素的本质特征,从而使得开发人员在升级改造中可以无需阅读源码即可得到更加合理的分类结果,降低了人工成本。