一种文本摘要自动生成方法

基本信息

申请号 CN202010070964.9 申请日 -
公开(公告)号 CN111241268A 公开(公告)日 2020-06-05
申请公布号 CN111241268A 申请公布日 2020-06-05
分类号 G06F16/34(2019.01)I;G06F40/211(2020.01)I 分类 计算;推算;计数;
发明人 缪弘;甘露 申请(专利权)人 上海七印信息科技有限公司
代理机构 上海天翔知识产权代理有限公司 代理人 上海七印信息科技有限公司
地址 201306上海市浦东新区泥城镇云汉路979号2楼
法律状态 -

摘要

摘要 本发明公开的一种文本摘要自动生成方法,包括以下步骤:接收需要生成摘要的文章;对接收到的文章进行分句处理,以将该文章分成若干句子;使用TextRank算法计算每一句子的内容相关度权重;根据预设的规则,计算每一句子的规则权重;使用滑动窗口的方法对计算得到的每一句子的内容相关度权重和规则权重进行处理,以计算在滑动窗口内每一句子的权重和;选取权重和最大的滑动窗口内的句子,并将选取的句子拼凑按照一定顺序拼凑形成该文章的摘要。本发明能够防止摘要中出现断句的情况,提升摘要的质量和通顺程度。