一种信息识别方法、装置、计算机设备和存储介质
基本信息
申请号 | CN201911420984.8 | 申请日 | - |
公开(公告)号 | CN111144373B | 公开(公告)日 | 2020-12-04 |
申请公布号 | CN111144373B | 申请公布日 | 2020-12-04 |
分类号 | G06K9/00;G06K9/62;G06F40/232 | 分类 | 计算;推算;计数; |
发明人 | 高宇明;田兴林;郭健;甄智;李科勇;郑捷 | 申请(专利权)人 | 广州市昊链信息科技股份有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | 广州市昊链信息科技股份有限公司 |
地址 | 510730 广东省广州市广州保税区保盈大道19号自编二栋101-109房 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种信息识别方法、装置、计算机设备和存储介质。该方法包括:接收原始文件;对所述原始文件进行光学字符识别,获得目标文件,所述目标文件中具有文本信息;查找与所述原始文件匹配的决策树模型;使用所述决策树模型,根据所述文本信息在所述目标文件中的位置关系、从所述文本信息中确定归属于指定类目的目标信息。自动化识别类目与目标信息之间的关系,大大减少用户手动浏览文本、筛选所需的信息并将该信息复制至可编辑的文档中的操作,从而提高了录入信息的操作的简便性,减少耗时。 |
