一种基于深度学习的文本摘要方法及系统

基本信息

申请号 CN202111439109.1 申请日 -
公开(公告)号 CN114385806A 公开(公告)日 2022-04-22
申请公布号 CN114385806A 申请公布日 2022-04-22
分类号 G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 徐书豪;王亚平;赖新明;王志刚;林文辉;伺彦伟;祁洪波 申请(专利权)人 河北航天信息技术有限公司
代理机构 北京工信联合知识产权代理有限公司 代理人 刘海蓉
地址 100195北京市海淀区杏石口路甲18号
法律状态 -

摘要

摘要 本发明实施例公开了一种基于深度学习的文本摘要方法及系统,其中方法包括:对目标文件进行中文分词和句子分割处理,将目标文件的原始文本划分为单独的句子;将划分为单独句子的原始文本转换为文本向量;对文本向量进行自注意力计算,得到包含语义信息的句子特征;对通过乱序的自注意力计算得到的各个句子特征进行加权整合,并对加权整合后的句子特征进行归一化处理,得到篇章级的句子特征;将篇章级的句子特征输入预先构建的分类模型,输出句子类别;根据句子类别将目标文件的原始文本划分为关键信息和非关键信息两部分;将关键信息按照合理的顺序进行排列组织,并将排列组织后的关键信息合成语义通顺、语法合规的摘要文本。