一种工资条项目识别方法、装置、设备及可读存储介质
基本信息
申请号 | CN201811444735.8 | 申请日 | - |
公开(公告)号 | CN109543668B | 公开(公告)日 | 2021-05-25 |
申请公布号 | CN109543668B | 申请公布日 | 2021-05-25 |
分类号 | G06K9/20(2006.01)I;G06K9/34(2006.01)I;G06K9/62(2006.01)I | 分类 | - |
发明人 | 钱力扬;王培勇;陈宏仁 | 申请(专利权)人 | 税友软件集团股份有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 罗满 |
地址 | 310053浙江省杭州市滨江区浦沿街道南环路3738号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种工资条项目识别方法,该方法包括以下步骤:获取目标工资条的项目序列,并对项目序列进行清洗,获得目标项目序列;利用完全匹配字典、模糊匹配字典和TF‑IDF分别对目标项目序列中的各个字段分别进行加权,获得完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵;对完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将综合加权矩阵中各个字段的向量输入至分类器中进行识别,获得识别结果。可提高工资条项目识别的准确率。本发明还公开了一种工资条项目识别装置、设备及可读存储介质,具有相应的技术效果。 |
