一种基于语义要素的低资源文本识别算法
基本信息
申请号 | CN202011001618.1 | 申请日 | - |
公开(公告)号 | CN112131887A | 公开(公告)日 | 2020-12-25 |
申请公布号 | CN112131887A | 申请公布日 | 2020-12-25 |
分类号 | G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 付勇;井友鼎;杜创胜;王旭峰;甘志芳;王顺智 | 申请(专利权)人 | 河南合众伟奇云智科技有限公司 |
代理机构 | 郑州知己知识产权代理有限公司 | 代理人 | 季发军 |
地址 | 450000河南省郑州市郑东新区平安大道南尚德街北永和龙子湖中央广场A座705 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于语义要素的低资源文本识别算法,属于自然语言理解技术领域。所述方法包括:获取文本句子,对文本句子进行编码处理,得到编码后的句子张量表示;对句子张量表示进行语义要素识别处理,得到语义要素识别结果;用语义要素识别结果对句子张量表示进行缩放处理;利用均值池化的方法对经缩放的句子张量表示进行处理,得到语义要素向量表示;利用均值池化的方法对句子张量表示进行处理,得到句子向量表示;将句子向量表示与语义要素向量表示进行拼接处理,得到句子最终表示;对句子最终表示进行处理,得到最终的文本类型概率。本发明引入语义要素识别任务使模型具备识别不同语义要素的能力,大大降低了指令文本分类任务的学习难度。 |
