文本摘要的生成方法、装置及计算机设备

基本信息

申请号 CN202111142825.3 申请日 -
公开(公告)号 CN113987162A 公开(公告)日 2022-01-28
申请公布号 CN113987162A 申请公布日 2022-01-28
分类号 G06F16/34(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 王伟;黄勇其;于翠翠;张黔 申请(专利权)人 华润数字科技(西安)有限公司
代理机构 深圳市世联合知识产权代理有限公司 代理人 姜妍
地址 710000陕西省西安市高新区天谷八路211号环普科技产业园C座303、304室
法律状态 -

摘要

摘要 本申请实施例属于人工智能和自然语言处理领域,应用于文本处理领域中,涉及一种文本摘要的生成方法、装置、计算机设备及存储介质,方法包括获取样本文本序列进行编码,得到所述样本文本序列的文本输入向量;从所述样本文本序列的随机位置开始进行掩码,得到掩码文本序列,所述掩码的长度为等差变化;对所述掩码文本序列进行位置编码,生成位置向量;基于所述位置向量与所述文本输入向量,对文本摘要模型进行训练,得到预训练的文本摘要模型;将目标文本输入到所述预训练的文本摘要模型,生成目标文本的摘要内容。该方法使得文本摘要模型能够捕捉长距离的依赖信息,进一步捕捉原始文本内蕴含的信息,解决长距离依赖带来的信息丢失问题。