文本有效信息的抽取方法及装置
基本信息
申请号 | CN201910430073.7 | 申请日 | - |
公开(公告)号 | CN110348003A | 公开(公告)日 | 2019-10-18 |
申请公布号 | CN110348003A | 申请公布日 | 2019-10-18 |
分类号 | G06F17/27 | 分类 | 计算;推算;计数; |
发明人 | 晋耀红;李健铨;赵红红;陈夏飞 | 申请(专利权)人 | 安徽省泰岳祥升软件有限公司 |
代理机构 | 北京弘权知识产权代理事务所(普通合伙) | 代理人 | 逯长明;许伟群 |
地址 | 230088 安徽省合肥市高新区习友路3333号中国(合肥)国际智能语音产业园研发中心楼405-5室 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种文本有效信息的抽取方法及装置,其中,所述方法包括:确定预设抽取模板信息中的结构化信息;在待抽取文本信息中确定第一抽取信息;确定所述预设抽取模板信息中非结构化信息对应的正则表达式;结合各所述正则表达式,确定所述待抽取文本信息中的第二抽取信息;利用自然语言处理工具和深度学习模型,确定所述待抽取文本信息中的第三抽取信息;生成最终抽取信息。本申请所提供的文本有效信息的抽取方法及装置能够通过递进式的抽取方法,针对不同的文本情况采用不同的抽取方法,不遗漏地抽取整体文本中的有效信息,进而有效提高文本有效信息的抽取准确率。 |
