一种基于语义的无监督自动摘要方法及系统

基本信息

申请号 CN202010677140.8 申请日 -
公开(公告)号 CN111813925A 公开(公告)日 2020-10-23
申请公布号 CN111813925A 申请公布日 2020-10-23
分类号 G06F16/34(2019.01)I 分类 计算;推算;计数;
发明人 冷若冰;蔡博克;阚野;张云;张京鹏;贲忠奇 申请(专利权)人 混沌时代(北京)教育科技有限公司
代理机构 北京鱼爪知识产权代理有限公司 代理人 混沌时代(北京)教育科技有限公司
地址 100088北京市海淀区北三环中路44号4号楼4层406
法律状态 -

摘要

摘要 本发明提出了一种基于语义的无监督自动摘要方法及系统,涉及深度学习领域。一种基于语义的无监督自动摘要方法包括:获取预设语义表达模型并存储权重;定义正确答案的领域词;获取句子的语义表征向量;计算每个句子之间的语义相似度;根据PageRank对以余弦距离相似度为边权值的无向图进行收敛计算;选取预设数量的句子作为摘要候选集;根据句法分析与领域词确定摘要;确定摘要候选集中得分最高的为最终摘要。其能够确保摘取出来的句子描述内容是和领域内容强相关的。此外本发明还提出了一种基于语义的无监督自动摘要系统,包括:第一获取模块、第一定义模块、第二获取模块、第一计算模块、第二计算模块、第一选取模块、第一确定模块和第二确定模块。