一种文档知识结构化的抽取方法及装置

基本信息

申请号 CN201911353441.9 申请日 -
公开(公告)号 CN111144116A 公开(公告)日 2020-05-12
申请公布号 CN111144116A 申请公布日 2020-05-12
分类号 G06F40/295;G06F40/258;G06F40/117;G06F16/33 分类 计算;推算;计数;
发明人 俞阳;韩姝娜;朱君;杜振东 申请(专利权)人 南京云问网络技术有限公司
代理机构 南京纵横知识产权代理有限公司 代理人 陕西省水利电力勘测设计研究院;国网江苏省电力有限公司电力科学研究院;南京云问网络技术有限公司
地址 211103 江苏省南京市江宁区帕威尔路1号
法律状态 -

摘要

摘要 本发明公开了一种文档知识结构化的抽取方法及装置,所述方法包括获取待处理文档;基于所述待处理文档的特征,选择合适的抽取规则;按照选中的抽取规则,抽取所述待处理文档中的知识点,并对抽取到的知识点做预设的处理,完成文档知识结构化的抽取。本发明能够实现运用自然语言处理技术对电力规章制度、法律法规、政策文件等文本文件进行知识点提取,实现对企业大量文本化知识的自主学习和更新维护。