一种基于语义要素的低资源文本识别算法

基本信息

申请号 CN202011001618.1 申请日 -
公开(公告)号 CN112131887A 公开(公告)日 2020-12-25
申请公布号 CN112131887A 申请公布日 2020-12-25
分类号 G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 付勇;井友鼎;杜创胜;王旭峰;甘志芳;王顺智 申请(专利权)人 河南合众伟奇云智科技有限公司
代理机构 郑州知己知识产权代理有限公司 代理人 季发军
地址 450000河南省郑州市郑东新区平安大道南尚德街北永和龙子湖中央广场A座705
法律状态 -

摘要

摘要 本发明提供了一种基于语义要素的低资源文本识别算法,属于自然语言理解技术领域。所述方法包括:获取文本句子,对文本句子进行编码处理,得到编码后的句子张量表示;对句子张量表示进行语义要素识别处理,得到语义要素识别结果;用语义要素识别结果对句子张量表示进行缩放处理;利用均值池化的方法对经缩放的句子张量表示进行处理,得到语义要素向量表示;利用均值池化的方法对句子张量表示进行处理,得到句子向量表示;将句子向量表示与语义要素向量表示进行拼接处理,得到句子最终表示;对句子最终表示进行处理,得到最终的文本类型概率。本发明引入语义要素识别任务使模型具备识别不同语义要素的能力,大大降低了指令文本分类任务的学习难度。