一种联合阅读课程学习机制的文本信息抽取系统及方法
基本信息
申请号 | CN202110045286.5 | 申请日 | - |
公开(公告)号 | CN112364125B | 公开(公告)日 | 2021-06-25 |
申请公布号 | CN112364125B | 申请公布日 | 2021-06-25 |
分类号 | G06F16/31;G06F16/35;G06F40/295 | 分类 | 计算;推算;计数; |
发明人 | 刘广峰 | 申请(专利权)人 | 杭州识度科技有限公司 |
代理机构 | 杭州华知专利事务所(普通合伙) | 代理人 | 束晓前 |
地址 | 310000 浙江省杭州市余杭区五常街道创智天地中心11幢501-506室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种联合阅读课程学习机制的文本信息抽取系统,包括:预处理模块:用于对输入文本进行纠错操作,降低噪声;粗粒度抽取模块:用于对预处理模块处理的文本进行实体识别和关系抽取,获取对应的实体集合和关系集合;细粒度抽取模块:用于对实体关系集合进行校验,输出预测结果集合;后处理模块:用于对预测结果集合进行规则处理,得到输入文本对应的结构化信息。本发明能够提升捕获实体和关系语境表示信息的能力;同时由于所采取模型结构简单可以一定程度上降低pipeline方法误差传播的影响,并进一步提升推理速度。 |
