一种针对已抽取的票据信息进行再加工的方法以及系统

基本信息

申请号 CN202111469522.2 申请日 -
公开(公告)号 CN114118054A 公开(公告)日 2022-03-01
申请公布号 CN114118054A 申请公布日 2022-03-01
分类号 G06F40/205(2020.01)I;G06F16/35(2019.01)I;G06F40/157(2020.01)I 分类 计算;推算;计数;
发明人 张强豪 申请(专利权)人 金科览智科技(北京)有限公司
代理机构 北京冬瓜知识产权代理事务所(普通合伙) 代理人 李佳
地址 100037北京市西城区阜成门外大街31号4层409C
法律状态 -

摘要

摘要 本发明提供了一种针对已抽取的票据信息进行再加工的方法及系统,所述票据信息再加工的方法包括:对于NER模型抽取的所有票据信息,检索抽取要素的标签名,并同时获取对应的实体内容进行拆解,所述拆解的方法通过AC自动机原理和KMP算法来实现;对于NER模型抽取的所有票据信息进行标准化处理以及信息补全。本发明的已抽取的票据信息再加工的方法针对不同的票据信息问题给予不同的解决方案,以实现在不同票据的NER(命名体识别)的基础上进行二次拆解和标准化。