一种基于深度学习和规则引擎的文本信息抽取方法及系统

基本信息

申请号 CN202010449750.2 申请日 -
公开(公告)号 CN111538805A 公开(公告)日 2020-08-14
申请公布号 CN111538805A 申请公布日 2020-08-14
分类号 G06F16/31(2019.01)I 分类 计算;推算;计数;
发明人 金勇;朱其斯;胡华;孙涛 申请(专利权)人 武汉烽火普天信息技术有限公司
代理机构 上海精晟知识产权代理有限公司 代理人 武汉烽火普天信息技术有限公司
地址 430000湖北省武汉市东湖开发区关山二路附4号
法律状态 -

摘要

摘要 本发明涉及一种基于深度学习和规则引擎的文本信息抽取方法及系统,所述方法具体包括以下步骤:S1:将输入的公安文档解析成可处理文本,并进行无用字符清洗及段落切割;S2:针对切割后的段落,抽取段落中所有出现的涉案涉线人员姓名与地址信息;S3:采用规则引擎抽取文档中涉案涉线人员相关属性,同时利用时间识别算法抽取段落中包含的线索信息;S4:通过语义理解模块确定S3中抽取的人员、线索信息对应关系,并进行人员称呼消歧及多关系融合,最后输出结构化结果。本申请的文本信息抽取方法和系统,采用深度学习模型与规则引擎相结合,促进非结构化文档信息的利用,实现人员与线索的快速相关联,提升公安民警的判案效率。