一种基于神经网络的文本信息提取方法及装置

基本信息

申请号 CN202011475339.9 申请日 -
公开(公告)号 CN112528643A 公开(公告)日 2021-03-19
申请公布号 CN112528643A 申请公布日 2021-03-19
分类号 G06N3/08(2006.01)I;G06F40/279(2020.01)I;G06F40/126(2020.01)I 分类 计算;推算;计数;
发明人 姚毅;王亚雷;张亚辉;周鹏;吕德贺 申请(专利权)人 上海栖盟科技有限公司
代理机构 上海专利商标事务所有限公司 代理人 陶玉龙;陆嘉
地址 200082上海市杨浦区通北路729号高和云峰大厦705室
法律状态 -

摘要

摘要 本发明涉及自然语言处理技术领域,更具体的说,涉及一种基于神经网络的文本信息提取方法及装置。本发明提出的基于神经网络的文本信息提取方法,包括以下步骤:S1、输入训练文本数据;S2、快速训练模式下的文本预处理,提取构造通用文本特征信息;S3、构造快速训练模型并进行训练;S4、深度训练模式下的文本预处理;S5、构造深度训练模型并进行训练,深度训练模型为编码器解码器结构;S6、根据快速训练模型和/或深度训练模型对文本信息进行预测。本发明通过构建通用的特征提取模块和模型训练模块实现初步的信息提取,结合进行远程监督对初步信息提取结果进行修正,实现信息的自定义提取,通用性高、成本低、准确率高。