一种基于机器学习的文书图谱抽取方法、装置及存储介质
基本信息
申请号 | CN202110121035.0 | 申请日 | - |
公开(公告)号 | CN112445915A | 公开(公告)日 | 2021-03-05 |
申请公布号 | CN112445915A | 申请公布日 | 2021-03-05 |
分类号 | G06F16/35(2019.01)I;G06F16/36(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 蓝建敏;李观春 | 申请(专利权)人 | 京华信息科技股份有限公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 常柯阳 |
地址 | 510520广东省广州市天河区高普路138号京华信息大楼中座 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于机器学习的文书图谱抽取方法、装置及存储介质。该方法包括获取文书文本,所述文书文本包括文书标题、文书体裁和文书内容;对所述文书文本进行碎片化处理,得到碎片化数据;根据所述碎片化数据,利用训练好的知识单元分类模型抽取文书图谱。本发明通过利用训练好的知识单元分类模型对文书文本进行抽取,得到结构化的文书图谱数据,能够自动形成“脑图结构”的文书图谱,让文书内容一目了然,能够大幅降低阅读时间,提高阅读质量。本发明可广泛应用于知识图谱技术领域。 |
