跨语言自动摘要生成方法、装置、计算机设备及存储介质
基本信息
申请号 | CN202011642808.1 | 申请日 | - |
公开(公告)号 | CN112711661A | 公开(公告)日 | 2021-04-27 |
申请公布号 | CN112711661A | 申请公布日 | 2021-04-27 |
分类号 | G06F16/34;G06F40/58;G06F40/126;G06F40/216;G06F40/189;G06N3/04 | 分类 | 计算;推算;计数; |
发明人 | 李文禄 | 申请(专利权)人 | 华润数字科技(西安)有限公司 |
代理机构 | 深圳市精英专利事务所 | 代理人 | 武志峰 |
地址 | 710000 陕西省西安市高新区天谷八路211号环普科技产业园C座303、304室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了跨语言自动摘要生成方法、装置、计算机设备及存储介质,该方法包括:获取待生成摘要的双语文本,并对所述双语文本进行预处理得到文本数据集;基于卷积神经网络和循环神经网络对所述文本数据集中的上下文信息进行全局编码,得到所述文本数据集的概要状态序列;利用多层Transformer网络对所述概要状态序列进行解码,并利用自注意力机制对解码后的结果进行计算,然后将得到的计算结果作为候选文本摘要;通过集束搜索对所述候选文本摘要进行约束,从而对所述候选文本摘要中的语句进行评分,并从评分后的候选文本摘要中选择评分最高的语句作为最终的摘要文本。本发明可以有效提高对于跨语言文本的摘要生成准确度以及摘要生成效率。 |
