一种联合阅读课程学习机制的文本信息抽取系统及方法

基本信息

申请号 CN202110045286.5 申请日 -
公开(公告)号 CN112364125B 公开(公告)日 2021-06-25
申请公布号 CN112364125B 申请公布日 2021-06-25
分类号 G06F16/31;G06F16/35;G06F40/295 分类 计算;推算;计数;
发明人 刘广峰 申请(专利权)人 杭州识度科技有限公司
代理机构 杭州华知专利事务所(普通合伙) 代理人 束晓前
地址 310000 浙江省杭州市余杭区五常街道创智天地中心11幢501-506室
法律状态 -

摘要

摘要 本发明涉及一种联合阅读课程学习机制的文本信息抽取系统,包括:预处理模块:用于对输入文本进行纠错操作,降低噪声;粗粒度抽取模块:用于对预处理模块处理的文本进行实体识别和关系抽取,获取对应的实体集合和关系集合;细粒度抽取模块:用于对实体关系集合进行校验,输出预测结果集合;后处理模块:用于对预测结果集合进行规则处理,得到输入文本对应的结构化信息。本发明能够提升捕获实体和关系语境表示信息的能力;同时由于所采取模型结构简单可以一定程度上降低pipeline方法误差传播的影响,并进一步提升推理速度。