一种基于语义要素的低资源文本识别算法专利查询专利号|摘要-满商公司网

一种基于语义要素的低资源文本识别算法

基本信息

申请号	CN202011001618.1	申请日	-
公开（公告）号	CN112131887A	公开（公告）日	2020-12-25
申请公布号	CN112131887A	申请公布日	2020-12-25
分类号	G06F40/30(2020.01)I	分类	计算；推算；计数;
发明人	付勇;井友鼎;杜创胜;王旭峰;甘志芳;王顺智	申请（专利权）人	河南合众伟奇云智科技有限公司
代理机构	郑州知己知识产权代理有限公司	代理人	季发军
地址	450000河南省郑州市郑东新区平安大道南尚德街北永和龙子湖中央广场A座705
法律状态	-

摘要

本发明提供了一种基于语义要素的低资源文本识别算法，属于自然语言理解技术领域。所述方法包括：获取文本句子，对文本句子进行编码处理，得到编码后的句子张量表示；对句子张量表示进行语义要素识别处理，得到语义要素识别结果；用语义要素识别结果对句子张量表示进行缩放处理；利用均值池化的方法对经缩放的句子张量表示进行处理，得到语义要素向量表示；利用均值池化的方法对句子张量表示进行处理，得到句子向量表示；将句子向量表示与语义要素向量表示进行拼接处理，得到句子最终表示；对句子最终表示进行处理，得到最终的文本类型概率。本发明引入语义要素识别任务使模型具备识别不同语义要素的能力，大大降低了指令文本分类任务的学习难度。