一种文档知识结构化的抽取方法及装置
基本信息
申请号 | CN201911353441.9 | 申请日 | - |
公开(公告)号 | CN111144116A | 公开(公告)日 | 2020-05-12 |
申请公布号 | CN111144116A | 申请公布日 | 2020-05-12 |
分类号 | G06F40/295;G06F40/258;G06F40/117;G06F16/33 | 分类 | 计算;推算;计数; |
发明人 | 俞阳;韩姝娜;朱君;杜振东 | 申请(专利权)人 | 南京云问网络技术有限公司 |
代理机构 | 南京纵横知识产权代理有限公司 | 代理人 | 陕西省水利电力勘测设计研究院;国网江苏省电力有限公司电力科学研究院;南京云问网络技术有限公司 |
地址 | 211103 江苏省南京市江宁区帕威尔路1号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种文档知识结构化的抽取方法及装置,所述方法包括获取待处理文档;基于所述待处理文档的特征,选择合适的抽取规则;按照选中的抽取规则,抽取所述待处理文档中的知识点,并对抽取到的知识点做预设的处理,完成文档知识结构化的抽取。本发明能够实现运用自然语言处理技术对电力规章制度、法律法规、政策文件等文本文件进行知识点提取,实现对企业大量文本化知识的自主学习和更新维护。 |
