一种抽取式无监督文本摘要方法

基本信息

申请号 CN201910289008.7 申请日 -
公开(公告)号 CN110008313A 公开(公告)日 2019-07-12
申请公布号 CN110008313A 申请公布日 2019-07-12
分类号 G06F16/33;G06F16/34 分类 计算;推算;计数;
发明人 周航成 申请(专利权)人 重庆华龙网海数科技有限公司
代理机构 北京劲创知识产权代理事务所(普通合伙) 代理人 重庆华龙网海数科技有限公司
地址 401121 重庆市渝北区青枫北路18号7-1
法律状态 -

摘要

摘要 本发明公开了一种抽取式无监督文本摘要方法,步骤如下:S1、将文本分割成若干组成单元(单词、句子)并建立图模型;S2、利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘;其中,建立模型和确定权重的的流程为:S201、预处理;S202、构建图G=(V,E),其中V为句子集,对句子进行分词、去除停止词,得S203、句子相似度计算:构建图G中的边集E,基于句子间的内容覆盖率,给定两个句子。本发明能够压缩文本信息冗余度,减少存储资源;增加了用户阅读信息的有效性,缩短文本阅读时间;能够根据外部数据进行权重以及权重库的调整,增加了很强的时效性;提高了效率,降低了运行成本。