文摘自动生成方法、装置、电子设备及存储介质

基本信息

申请号 CN202010898531.2 申请日 -
公开(公告)号 CN112183083A 公开(公告)日 2021-01-05
申请公布号 CN112183083A 申请公布日 2021-01-05
分类号 G06F40/284;G06F40/295;G06F40/216;G06F40/242;G06F16/35;G06F40/126 分类 计算;推算;计数;
发明人 嵇望;王伟凯;郭心南;董悦;李舟扬;钱艳;安毫亿;朱鹏飞;梁青 申请(专利权)人 杭州远传新业科技股份有限公司
代理机构 杭州创智卓英知识产权代理事务所(普通合伙) 代理人 杭州远传新业科技有限公司
地址 310051 浙江省杭州市滨江区信诚路857号世贸中心23楼
法律状态 -

摘要

摘要 本发明公开了一种文摘自动生成方法、装置、电子设备和存储介质,该方法将原始文本和原始文本中的命名实体分别基于两个训练好的嵌入向量模型计算得到各单字的第一字符向量和第二字符向量并通过拼接得到各单字的词向量;通过训练好的Transformer编解码模型对各单字的词向量编解码处理得到多个生成词的词向量,可以增强多个生成词的词向量的特征表示能力,将每个生成词分为第一类生成词或第二类生成词,对第一类生成词和第二类生成词分别采用训练好的指针网络和记忆网络计算分别得到第一类输出词和第二类输出词,由多个第一类输出词和/或多个第二类输出词组成目标文摘,可以有效解决生僻的命名实体无法生成的问题。