一种工资条项目识别方法、装置、设备及可读存储介质

基本信息

申请号 CN201811444735.8 申请日 -
公开(公告)号 CN109543668B 公开(公告)日 2021-05-25
申请公布号 CN109543668B 申请公布日 2021-05-25
分类号 G06K9/20(2006.01)I;G06K9/34(2006.01)I;G06K9/62(2006.01)I 分类 -
发明人 钱力扬;王培勇;陈宏仁 申请(专利权)人 税友软件集团股份有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 罗满
地址 310053浙江省杭州市滨江区浦沿街道南环路3738号
法律状态 -

摘要

摘要 本发明公开了一种工资条项目识别方法,该方法包括以下步骤:获取目标工资条的项目序列,并对项目序列进行清洗,获得目标项目序列;利用完全匹配字典、模糊匹配字典和TF‑IDF分别对目标项目序列中的各个字段分别进行加权,获得完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵;对完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将综合加权矩阵中各个字段的向量输入至分类器中进行识别,获得识别结果。可提高工资条项目识别的准确率。本发明还公开了一种工资条项目识别装置、设备及可读存储介质,具有相应的技术效果。