一种抽取式无监督文本摘要方法
基本信息

| 申请号 | CN201910289008.7 | 申请日 | - |
| 公开(公告)号 | CN110008313A | 公开(公告)日 | 2019-07-12 |
| 申请公布号 | CN110008313A | 申请公布日 | 2019-07-12 |
| 分类号 | G06F16/33;G06F16/34 | 分类 | 计算;推算;计数; |
| 发明人 | 周航成 | 申请(专利权)人 | 重庆华龙网海数科技有限公司 |
| 代理机构 | 北京劲创知识产权代理事务所(普通合伙) | 代理人 | 重庆华龙网海数科技有限公司 |
| 地址 | 401121 重庆市渝北区青枫北路18号7-1 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种抽取式无监督文本摘要方法,步骤如下:S1、将文本分割成若干组成单元(单词、句子)并建立图模型;S2、利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘;其中,建立模型和确定权重的的流程为:S201、预处理;S202、构建图G=(V,E),其中V为句子集,对句子进行分词、去除停止词,得S203、句子相似度计算:构建图G中的边集E,基于句子间的内容覆盖率,给定两个句子。本发明能够压缩文本信息冗余度,减少存储资源;增加了用户阅读信息的有效性,缩短文本阅读时间;能够根据外部数据进行权重以及权重库的调整,增加了很强的时效性;提高了效率,降低了运行成本。 |





